OCR форумы Добро пожаловать, Гость. Пожалуйста, выберите Вход или Регистрация
Форум переведен из кодировки UTF-8 в кодировку WINDOWS-1251. По всем вопросам, связанным с кодировкой текста (появлением «кракозябр»), обращайтесь к Администратору.
The forum is translated from the UTF-8 encoding to the WINDOWS-1251 encoding. For all questions related to the encoding of the text (the appearance of 'krakozyabr'), please contact the Administrator.
 
  ГлавнаяСправкаПоискВходРегистрация Администратор Библиотека  
 
Переключение на Главную Страницу Страниц: 1
Послать Тему Печать
Автоматическое распознавание множества PDF файлов AutoIt скриптом (Прочитано 2586 раз)
opliaboy
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 50
Автоматическое распознавание множества PDF файлов AutoIt скриптом
22.01.2015 :: 15:13:33
 
Предлагаю в теме делиться наработками по данному вопросу. Свой опыт выложил по адресу:
http://vedomo.ru/a/s/paketnaia/AutoItOcrpdf.htm
Наверх
 
 
IP записан
 
opliaboy
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 50
Re: Автоматическое распознавание множества PDF файлов AutoIt скриптом
Ответ #1 - 10.12.2016 :: 21:37:29
 
Добавил новую информацию внизу заглавной страницы
http://vedomo.ru/a/s/paketnaia/raspoznati-mnogo-PDFiDJVU.htm
Наверх
 
 
IP записан
 
opliaboy
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 50
Re: Автоматическое распознавание множества PDF файлов AutoIt скриптом
Ответ #2 - 12.12.2016 :: 11:15:14
 
Дописал вариант настроек сжимания файла для забеленных картинок, так как в одном варианте качество получилось плохое. Эксперимент показал, что 60% при 300 дпи исправляет ситуацию. Сейчас думаю, что такие настройки надо выставлять по умолчанию для всех документов, не только забеленных, когда переделываем файл, который сохраняется с очень большим размером.
Наверх
« Последняя редакция: 12.12.2016 :: 12:26:33 от opliaboy »  
 
IP записан
 
opliaboy
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 50
Re: Автоматическое распознавание множества PDF файлов AutoIt скриптом
Ответ #3 - 18.02.2017 :: 07:34:31
 
Изменил своё мнение насчёт того, что лучше открывать пакет в Finereader 9 для пересохранения при большом размере файла на выходе. Может быть лучше просто пересохранить в Finereader 8 с настройками «Picture settings» «Medium (for screen)». Бывает что нормально жмёт. А если нет, то при открытии в Finereader 9 там выставляется галочка на «Use Mixed Raster Content». Её надо обязательно снять. Иначе возможен вариант, как на скриншотах (и формулы тоже закрашивает местами, так что не понятно, что написано):
... ...
Скриншоты из книги из книги авторов А.В. Пёрышкин, Е.М. Гутник «Физика. 9 класс» 2014.
Наверх
 
 
IP записан
 
opliaboy
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 50
Re: Автоматическое распознавание множества PDF файлов AutoIt скриптом
Ответ #4 - 12.04.2017 :: 19:22:38
 
Планирую заказать скрипт для пакетного пересохранения пакетов из Finereader 8 через Finereader 9 для получения через него на выходе PDF, так как в девятке больше настроек, которые могут влиять на качество. Программист запросил $20. Разместил объявление о поиске более дешёвой услуги. Если у кого есть на это дело денежные знаки, можете подкинуть денег.
Наверх
 
 
IP записан
 
opliaboy
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 50
Re: Автоматическое распознавание множества PDF файлов AutoIt скриптом
Ответ #5 - 30.06.2017 :: 09:51:43
 
Проблему с остановкой перед сохранением в PDF в некоторых случаях можно решить добавлением в самый верх (вставить дополнительную строку в скрипт):
Opt("SendKeyDelay", 700)
Наверх
 
 
IP записан
 
opliaboy
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 50
Re: Автоматическое распознавание множества PDF файлов AutoIt скриптом
Ответ #6 - 19.08.2017 :: 07:34:04
 
Потребовалось распознать несколько файлов в 60-70 мегабайт в примерно 100 страниц каждый с изображениями, которые всё равно вызывали остановку. Увеличил задержку в 10 раз и помогло.
Opt("SendKeyDelay", 7000)
Наверх
 
 
IP записан
 
Переключение на Главную Страницу Страниц: 1
Послать Тему Печать