Потребовалось изменить DPI для более успешного распознавания документа. В справке есть такой текст:
Цитата:"Scale": для каждой книги, эти две поля используются, только если тиффы
декодированы в другом разрешении, например из книги в 150dpi сделаны тиффы в 600dpi. Последнее необходимо, когда книга сканирована в плохом качестве, и надо
повысить качество распознавания. Тогда в поля "Scale" надо указать соотношение между оригинальном и декодировано dpi, например в случае 4/1.
Подбором этих чисел можно настроит чтобы OCR лег прямо на тексте. Для этого можно выбрать в случае 402/100, чтобы компенсировать ошибки округления
(особенно при малых оригинальных dpi).
Правда, не всегда очевидно, какое правильное отношение, так что здесь работает
метод проб и ошибок - после окончания работы книга просматривается, маркируется
страница мышью, и сравнивается положение маркированного текста и
сам текст, и процесс повторяется с другое соотношение до полной
победы.
А чтобы, например выставить 600 DPI, какое соотношение надо прописать для начала? А для 300 DPI?
Что означает: "маркируется страница мышью, и сравнивается положение маркированного текста и сам текст"?