OCR форумы Добро пожаловать, Гость. Пожалуйста, выберите Вход или Регистрация
Форум переведен из кодировки UTF-8 в кодировку WINDOWS-1251. По всем вопросам, связанным с кодировкой текста (появлением «кракозябр»), обращайтесь к Администратору.
The forum is translated from the UTF-8 encoding to the WINDOWS-1251 encoding. For all questions related to the encoding of the text (the appearance of 'krakozyabr'), please contact the Administrator.
 
  ГлавнаяСправкаПоискВходРегистрация Администратор Библиотека  
 
Переключение на Главную Страницу Страниц: 1
Послать Тему Печать
Обработка изображений низкого разрешения (Прочитано 3622 раз)
chatt
Новичок
*
Вне Форума


Всем привет!

Сообщений: 15
Обработка изображений низкого разрешения
16.08.2016 :: 14:52:07
 
Посоветуйте, чем вылечить низкокачественные изображения, выдранные из предпросмотра.
http://rusfolder.com/45219057
Не могу подобрать подходящий инструмент, чтобы довести книгу до ума и распознать.
PDF или DJVU значения не имеет, главное качетвенно распознать.
Может у кого есть такой опыт?
Наверх
 
 
IP записан
 
maddy
Постоялец
**
Вне Форума



Сообщений: 62
Пол: male
Re: Обработка изображений низкого разрешения
Ответ #1 - 16.08.2016 :: 16:51:23
 
Обработку сделал с помощью Corel PHOTO-PAINT:
1. увеличить разрешение до 600 dpi
2. гамма - 0,29
3. преобразовать в черно-белый, метод преобразования - штриховой рисунок.
Вероятно, можно получить тот результат в Scan Kromsator.

Распознавание - ABBYY FineReader 12.
В данном случае, нужно было еще добавить немецкий язык, в примечании не обратил внимания.
Результаты и скрипт Corel - в архиве. Все просто оказалось.
https://www.upload.ee/files/6071497/example-out.zip.html
Наверх
« Последняя редакция: 16.08.2016 :: 17:00:07 от maddy »  
 
IP записан
 
chatt
Новичок
*
Вне Форума


Всем привет!

Сообщений: 15
Re: Обработка изображений низкого разрешения
Ответ #2 - 16.08.2016 :: 17:28:37
 
Отлично, спасибо
А как быть с другими страницами, на которых есть цветные картинки? Можно ли обойтись без преобразования в монохром?
Какая версия Corel PHOTO-PAINT?
Вот весь файл, из pdf вынимал несжатые тифы Aiseesoft PDF Converter'ом (на мой взгляд наиболее адекватный способ)
https://www.upload.ee/files/6071609/_______________________________________.____...
Наверх
 
 
IP записан
 
maddy
Постоялец
**
Вне Форума



Сообщений: 62
Пол: male
Re: Обработка изображений низкого разрешения
Ответ #3 - 16.08.2016 :: 18:04:47
 
Цитата:
Какая версия Corel PHOTO-PAINT?
X6. Хотя версия тут не важна, это простейшие операции.

Цитата:
А как быть с другими страницами, на которых есть цветные картинки? Можно ли обойтись без преобразования в монохром?
А как вы представляете конечный результат - в каком формате, нужно ли сохранение оригинальной компоновки и т.п.?
Если я правильно понял, вы хотели получить распознанный текст.
Если нужно получить обработанный графический DJVU/PDF файл с текстовым слоем, я думаю, результат будет очень низкого качества.
Для отдельной обработки текста от иллюстраций можно воспользоваться Scan Kromsator или Scan Tailor (что будете делать с формулами, придется все набирать вручную или всталять как изображения?).

Последовательность для SK:
1. Выделить зоны иллюстраций как "picture zone"
2. Подобрать параметры для текста, выполнить обработку в самом кромсаторе. В данном случае лучше не использовать Corel, а выполнить обработку в кромсаторе, все равно его используем для выделения изображений. (Или делать вывод текста серым - File - Color - Gray, далее полученные файлы с текстом обработать в Corel, сохранить с заменой в тот же каталог).
3. Меню Zones - Picture zone - Merge zones

Для ST:
1. Вывод - режим смешанный
2. Выделить изображения
3. Подобрать порог и сделать обработку

Далее распознавание.
Наверх
« Последняя редакция: 17.08.2016 :: 02:30:12 от maddy »  
 
IP записан
 
chatt
Новичок
*
Вне Форума


Всем привет!

Сообщений: 15
Re: Обработка изображений низкого разрешения
Ответ #4 - 17.08.2016 :: 14:52:50
 
Результат  - файл pdf или djvu из улучшенных изображений со слоем текста под ними.

Сканкромсатором пробовал, но не смог подобрать настройки для данного случая. Экспортируйте, пожалуйста, профиль, которым у Вас получилось обработать страницы с текстом. С отдельной обработкой зон сталкивался, знаю.

Распознанный слой вычитывать не собираюсь, нужен лишь для возможности поиска. Просто хочется довести качество изображений до пригодного для распознавания и распечатки.
Наверх
 
 
IP записан
 
maddy
Постоялец
**
Вне Форума



Сообщений: 62
Пол: male
Re: Обработка изображений низкого разрешения
Ответ #5 - 17.08.2016 :: 15:23:29
 
Цитата:
Экспортируйте, пожалуйста, профиль, которым у Вас получилось обработать страницы с текстом.

https://www.upload.ee/files/6074549/example_sk-out.zip.html
Наверх
 
 
IP записан
 
chatt
Новичок
*
Вне Форума


Всем привет!

Сообщений: 15
Re: Обработка изображений низкого разрешения
Ответ #6 - 17.08.2016 :: 15:33:31
 
Спасибо, поробую.
Жаль, что края букв кривоватые. Но вполне возможно, что лучше и не сделать.
Наверх
 
 
IP записан
 
maddy
Постоялец
**
Вне Форума



Сообщений: 62
Пол: male
Re: Обработка изображений низкого разрешения
Ответ #7 - 17.08.2016 :: 15:39:01
 
Добавьте тогда отметку на вкладке C.Smooth.
Наверх
 
 
IP записан
 
chatt
Новичок
*
Вне Форума


Всем привет!

Сообщений: 15
Re: Обработка изображений низкого разрешения
Ответ #8 - 17.08.2016 :: 15:47:54
 
Где эта вкладка?
Или можно итоговый профиль
Наверх
 
 
IP записан
 
maddy
Постоялец
**
Вне Форума



Сообщений: 62
Пол: male
Re: Обработка изображений низкого разрешения
Ответ #9 - 17.08.2016 :: 17:23:20
 
В окне обработки вкладка там же, где другие настройки, например, Binarization, или в окне Profiles - вкладка Filters, область Contour Smooth.

https://www.upload.ee/files/6074890/example-2.zip.html
Наверх
 
 
IP записан
 
chatt
Новичок
*
Вне Форума


Всем привет!

Сообщений: 15
Re: Обработка изображений низкого разрешения
Ответ #10 - 17.08.2016 :: 17:32:13
 
Спасибо, теперь лучше. Буду пробовать
Наверх
 
 
IP записан
 
Переключение на Главную Страницу Страниц: 1
Послать Тему Печать