OCR форум - Есть доступное распознание большого текста с помощью нейросетей?

Выбор языка:

Добро пожаловать, Гость. Пожалуйста, выберите Вход или Регистрация

Всем привет!
Hi all!

OCR форум › Создание и чтение электронных книг › Общие проблемы создания электронных изданий › Есть доступное распознание большого текста с помощью нейросетей?

(Модератор: Dmitry7)

‹ Предыдущая тема | Следующая тема ›

Страниц: 1

Есть доступное распознание большого текста с помощью нейросетей? (Прочитано 417 раз)

BolgarchukR

Новичок

Вне Форума

Всем привет!

Сообщений: 29
Украина, Днепр
Пол: male

Есть доступное распознание большого текста с помощью нейросетей?
16.11.2023 :: 22:47:52

Вроде-бы чат GPT-4 может обрабатывать большие объёмы данных, но он к сожалению платный, может есть бесплатные аналоги типа Клауд или расширения, которые могли бы именно качественнее FineReader обрабатывать книги 50-100 стр..? Конечно, с большинством задач вполне успешно справляется и FineReader, но с плохо отсканированным текстом, формулами, некоторыми картинками и экстравагантными шрифтами он не справляется. Ведутся ли вообще разработки в этом направлении? Сейчас нейросети творят чудеса, и многое внедряют даже в Фотошоп, но FineReader…?
А в обще в идеале, и думаю нет технических препятствий, вовсе создать бесплатную портативную версию, типа Стейбл дифюжен, но заточенную именно на распознания текста, или дообучить тот же стейбл, он из всех мне известных наиболее гибкий и демократичный, хотя и тоже сырой. В общем кто что знает? Идея у меня возникла при попытке распознать файнридером Томас Кормен Чарльз Лейзерсон Рональд Ривест Клиффорд Штайн «Алгоритмы построение и анализ» буквально на 100 странице. А там таких страниц 1200. Я книги люблю слушать, т.к. читать некогда. Хотелось бы, например, настроить при распознании, что бы формулы не распознавало, делая их картинками. Или может ИИ справилось бы и с формулами, однако их тоже не просто воспринимать на слух, поэтому как-то свернуть их в спойлер, если такое возможно или описать словами, что уже на грани фантастики. Тем не менее распознавать текст многие бесплатные чат-боты могут уже сейчас. Но короткий. С ними работать удобнее, в отличии от FineReader можно дать промт-запрос
Сколько полезной информации остаётся не задействованной из-за того, что нет возможности с неё полноценно работать как с текстом. Я понимаю, что есть авторские права, однако часто от таких прав больше вреда чем пользы.
Впрочем, кому нужна полезная информация в эпоху наёмного рабства и идиократии. Нужны красивые картинки, а не грамотные мысли и люди.
П.с.
Одна надежда на Искусственный интеллект. Может он не только распознает эти и подобные труды книги, но и проанализирует их за счёт чего станет умнее.
Если они до сих пор не распознаны То вряд ли он о них знает. Хотя бы даже за саму эту идею… Впрочем он ещё слишком мал чтобы знать…

Наверх

IP записан

Lykas

Патриарх

Вне Форума

Всем привет!

Сообщений: 1109

Re: Есть доступное распознание большого текста с помощью нейросетей?
Ответ #1 - 17.11.2023 :: 17:24:03

ИМХО распознавать отсканированный текст чат-ботами... Странновато это... слишком большой уровень шума для этого в сканах...
Вот для обработки уже распознанного текста - еще более-менее...

Наверх

IP записан

BolgarchukR

Новичок

Вне Форума

Всем привет!

Сообщений: 29
Украина, Днепр
Пол: male

Re: Есть доступное распознание большого текста с помощью нейросетей?
Ответ #2 - 12.12.2023 :: 23:11:11

Спросил в четырёх местах и только здесь ответили. Неужели эта тема не актуальна? Или Люди уже друг с другом не общаются, впрочем, зачем есть намного более умные чем мы нейросети. Постараюсь под спойлером добавить Один из диалогов с Bing У остальных времени спрашивать Нет. Да и вообще надо пробовать...

Спойлер:

Ваш вопрос очень интересный и актуальный. Действительно, сегодня ведутся активные разработки в области распознавания текста с помощью искусственного интеллекта. Однако, стоит отметить, что большинство эффективных решений в этой области все еще являются платными, и бесплатные аналоги могут быть ограничены в функциональности или качестве распознавания.
Вот некоторые бесплатные аналоги ABBYY FineReader, которые могут быть полезны12:
• Finereader-онлайн — бесплатная версия ограничена, но может быть полезна для небольших задач1.
• newocr.com — бесплатный сервис, но может содержать ошибки и не предоставляет форматирование1.
• free-ocr.com — имеет ограничения по размеру файла1.
• SimpleOCR — бесплатная версия этой программы сильно ограничена в функциональности и может распознавать только тексты на английском и французском языках2.
Также стоит отметить, что ведутся разработки в направлении распознавания текста с помощью ИИ3456. Например, компания Smart Engines разрабатывает продукты для автоматического распознавания документов3.
Что касается распознавания формул, то это действительно сложная задача, и на текущий момент большинство систем распознавания текста испытывают трудности с ней. Однако, ведутся исследования и разработки в этом направлении7.
По поводу “Стейбл дифюжен”, насколько мне известно, это инструмент для генерации изображений, а не для распознавания текста8910. Однако, в области распознавания текста существуют другие инструменты, такие как Convertio11 и img2txt12, которые могут быть полезны.

Я - Да, Стейбл дифюжен в основном направлен на генерацию изображения, но там есть и функции картинка-картинка. Т.е. он работает и с картинками и понимает, что на них, поэтому не вижу причин не понять буквы на картинке и потом выдать текст. Да, его может потребуется дообучить, но уже сейчас к нему появляется множество разных плагинов под разные смежные задачи. Может уже появился и плагин, который анализирует картинку и распознаёт на ней текст?

Оба сервиса предлагают множество функций для работы с текстом и изображениями. Однако, только img2txt указывает на использование искусственного интеллекта (в частности, движка Tesseract OCR) в своих возможностях4.
Что касается аналогов, то существуют другие сервисы, которые используют нейросети для распознавания текста678. Однако, большинство из них также могут быть платными или иметь ограниченную функциональность в бесплатной версии. К сожалению, на данный момент мне не известны бесплатные аналоги, которые бы хорошо распознавали текст с использованием нейросетей.

Обзор
На данный момент, мне не известно о существовании плагина для Stable Diffusion, который бы специализировался на распознавании текста на изображениях12345. Stable Diffusion действительно обладает впечатляющими возможностями в области генерации изображений и обработки изображений12345, но его основная задача - это создание новых изображений на основе текстовых запросов12345.
Однако, ваша идея о расширении функционала Stable Diffusion для распознавания текста на изображениях звучит очень интересно. Возможно, в будущем появятся такие разработки.
В любом случае, я рекомендую следить за обновлениями Stable Diffusion и других подобных инструментов, так как область искусственного интеллекта постоянно развивается и появляются новые возможности.

Наверх

IP записан

Lykas

Патриарх

Вне Форума

Всем привет!

Сообщений: 1109

Re: Есть доступное распознание большого текста с помощью нейросетей?
Ответ #3 - 13.12.2023 :: 00:52:08

Если (вопрос даже не когда - дрессировка для разовой задачи займет уйму человеко-часов) нейросеть сможет адекватно распознать такое:
https://disk.yandex.ru/i/64n-pdxLZR0Qvg
ИМХО на первом этапе более продуктивно натаскивание нейросети на составление пакета FR (хотя бы на уровне самого FR) или для составления задания Кромсатора\СТейлора.

Наверх

IP записан

Iskander Постоялец Вне Форума Сообщений: 68	Re: Есть доступное распознание большого текста с помощью нейросетей? Ответ #4 - 13.12.2023 :: 22:24:05 Тут инструмент гугла на тему, с демо-загрузкой — https://cloud.google.com/document-ai#demo
Наверх	IP записан

Страниц: 1

‹ Предыдущая тема | Следующая тема ›

« Главная

‹ Раздел

Наверх этой страницы