OCR форумы Добро пожаловать, Гость. Пожалуйста, выберите Вход или Регистрация
Всем привет!
Hi all!
 
  ГлавнаяСправкаПоискВходРегистрация Администратор Библиотека  
 
Переключение на Главную Страницу Страниц: 1
Послать Тему Печать
Есть доступное распознание большого текста с помощью нейросетей? (Прочитано 372 раз)
BolgarchukR
Новичок
*
Вне Форума


Всем привет!

Сообщений: 29
Украина, Днепр
Пол: male
Есть доступное распознание большого текста с помощью нейросетей?
16.11.2023 :: 22:47:27
 
Вроде-бы чат GPT-4 может обрабатывать большие объёмы данных, но он к сожалению платный, может есть бесплатные аналоги типа Клауд или расширения, которые могли бы именно качественнее FineReader обрабатывать книги 50-100 стр..? Конечно, с большинством задач вполне успешно справляется и FineReader, но с плохо отсканированным текстом, формулами, некоторыми картинками и экстравагантными шрифтами он не справляется. Ведутся ли вообще разработки в этом направлении? Сейчас нейросети творят чудеса, и многое внедряют даже в Фотошоп, но FineReader…? 
А в обще в идеале, и думаю нет технических препятствий, вовсе создать бесплатную портативную версию, типа Стейбл дифюжен, но заточенную именно на распознания текста, или дообучить тот же стейбл, он из всех мне известных наиболее гибкий и демократичный, хотя и тоже сырой. В общем кто что знает? Идея у меня возникла при попытке распознать файнридером Томас Кормен Чарльз Лейзерсон Рональд Ривест Клиффорд Штайн «Алгоритмы построение и анализ» буквально на 100 странице. А там таких страниц 1200. Я книги люблю слушать, т.к. читать некогда. Хотелось бы, например, настроить при распознании, что бы формулы не распознавало, делая их картинками. Или может ИИ справилось бы и с формулами, однако их тоже не просто воспринимать на слух, поэтому как-то свернуть их в спойлер, если такое возможно или описать словами, что уже на грани фантастики. Тем не менее распознавать текст многие бесплатные чат-боты могут уже сейчас. Но короткий. С ними работать удобнее, в отличии от FineReader можно дать промт-запрос
Сколько полезной информации остаётся не задействованной из-за того, что нет возможности с неё полноценно работать как с текстом. Я понимаю, что есть авторские права, однако часто от таких прав больше вреда чем пользы.
Впрочем, кому нужна полезная информация в эпоху наёмного рабства и идиократии. Нужны красивые картинки, а не грамотные мысли и люди.
П.с.
Одна надежда на Искусственный интеллект.  Может он не только распознает эти и подобные труды книги, но и проанализирует их за счёт чего станет умнее.
Если они до сих пор не распознаны То вряд ли он  о них знает. Хотя бы даже за саму эту идею… Впрочем он ещё слишком мал чтобы знать…
Наверх
 
romanbolgar_1 romanbolgar  
IP записан
 
Lykas
Патриарх
*****
Вне Форума


Всем привет!

Сообщений: 1089
Re: Есть доступное распознание большого текста с помощью нейросетей?
Ответ #1 - 17.11.2023 :: 17:23:38
 
ИМХО распознавать отсканированный текст чат-ботами... Странновато это... слишком большой уровень шума для этого в сканах...
Вот для обработки уже распознанного текста - еще более-менее...
Наверх
 
 
IP записан
 
BolgarchukR
Новичок
*
Вне Форума


Всем привет!

Сообщений: 29
Украина, Днепр
Пол: male
Re: Есть доступное распознание большого текста с помощью нейросетей?
Ответ #2 - 12.12.2023 :: 23:10:46
 
Спросил в четырёх местах и только здесь ответили. Неужели эта тема не актуальна? Или Люди уже друг с другом не общаются, впрочем, зачем есть намного более умные чем мы нейросети. Постараюсь под спойлером добавить Один из диалогов с Bing У остальных времени спрашивать Нет. Да и вообще надо пробовать...
Спойлер:
Ваш вопрос очень интересный и актуальный. Действительно, сегодня ведутся активные разработки в области распознавания текста с помощью искусственного интеллекта. Однако, стоит отметить, что большинство эффективных решений в этой области все еще являются платными, и бесплатные аналоги могут быть ограничены в функциональности или качестве распознавания.
Вот некоторые бесплатные аналоги ABBYY FineReader, которые могут быть полезны12:
•      Finereader-онлайн — бесплатная версия ограничена, но может быть полезна для небольших задач1.
•      newocr.com — бесплатный сервис, но может содержать ошибки и не предоставляет форматирование1.
•      free-ocr.com — имеет ограничения по размеру файла1.
•      SimpleOCR — бесплатная версия этой программы сильно ограничена в функциональности и может распознавать только тексты на английском и французском языках2.
Также стоит отметить, что ведутся разработки в направлении распознавания текста с помощью ИИ3456. Например, компания Smart Engines разрабатывает продукты для автоматического распознавания документов3.
Что касается распознавания формул, то это действительно сложная задача, и на текущий момент большинство систем распознавания текста испытывают трудности с ней. Однако, ведутся исследования и разработки в этом направлении7.
По поводу “Стейбл дифюжен”, насколько мне известно, это инструмент для генерации изображений, а не для распознавания текста8910. Однако, в области распознавания текста существуют другие инструменты, такие как Convertio11 и img2txt12, которые могут быть полезны.


Я - Да, Стейбл дифюжен в основном направлен на генерацию изображения, но там есть и функции картинка-картинка. Т.е. он работает и с картинками и понимает, что на них, поэтому не вижу причин не понять буквы на картинке и потом выдать текст. Да, его может потребуется дообучить, но уже сейчас к нему появляется множество разных плагинов под разные смежные задачи. Может уже появился и плагин, который анализирует картинку и распознаёт на ней текст?

Оба сервиса предлагают множество функций для работы с текстом и изображениями. Однако, только img2txt указывает на использование искусственного интеллекта (в частности, движка Tesseract OCR) в своих возможностях4.
Что касается аналогов, то существуют другие сервисы, которые используют нейросети для распознавания текста678. Однако, большинство из них также могут быть платными или иметь ограниченную функциональность в бесплатной версии. К сожалению, на данный момент мне не известны бесплатные аналоги, которые бы хорошо распознавали текст с использованием нейросетей.

Обзор
На данный момент, мне не известно о существовании плагина для Stable Diffusion, который бы специализировался на распознавании текста на изображениях12345. Stable Diffusion действительно обладает впечатляющими возможностями в области генерации изображений и обработки изображений12345, но его основная задача - это создание новых изображений на основе текстовых запросов12345.
Однако, ваша идея о расширении функционала Stable Diffusion для распознавания текста на изображениях звучит очень интересно. Возможно, в будущем появятся такие разработки.
В любом случае, я рекомендую следить за обновлениями Stable Diffusion и других подобных инструментов, так как область искусственного интеллекта постоянно развивается и появляются новые возможности.
Наверх
 
romanbolgar_1 romanbolgar  
IP записан
 
Lykas
Патриарх
*****
Вне Форума


Всем привет!

Сообщений: 1089
Re: Есть доступное распознание большого текста с помощью нейросетей?
Ответ #3 - 13.12.2023 :: 00:51:43
 
Если (вопрос даже не когда - дрессировка для разовой задачи займет уйму человеко-часов) нейросеть сможет адекватно распознать такое:
https://disk.yandex.ru/i/64n-pdxLZR0Qvg
ИМХО на первом этапе более продуктивно натаскивание нейросети на составление пакета FR (хотя бы на уровне самого FR)  или для составления задания Кромсатора\СТейлора.
Наверх
 
 
IP записан
 
Iskander
Постоялец
**
Вне Форума



Сообщений: 67
Re: Есть доступное распознание большого текста с помощью нейросетей?
Ответ #4 - 13.12.2023 :: 22:23:40
 
Тут инструмент гугла на тему, с демо-загрузкой — https://cloud.google.com/document-ai#demo
Наверх
 
 
IP записан
 
Переключение на Главную Страницу Страниц: 1
Послать Тему Печать