Цитата:Кстати, посмотри тему BookRestorer в "Технология OCR" - это полезная программа для коррекции изображений перед сжатием в djvu. По крайней мере исправление наклона страниц еще красивее сделает твои djvu...
BookRestorer я не пробовал, а вот Кромсатором я пытался работать. Мне что-то тогда не понравилось, сейчас не помню. Будет время, попробую этот Ресторер. По идее такие проги должны и размер файла сокращать: грязь вычищать, границы обрезать и т.п.
Цитата:Еще - теоретически, если вначале вставить страницы с большим dpi, а потом с меньшим (до размера словаря 20), то возможно в конечных страницах будет меньше ошибок, т.к. в словаре будут хорошие эталоны... Но это теоретически...
Теоретически - значит никто не пробовал. Может и не сработать это.
Я не очень силен в теории, но тут, насколько я понимаю, идея заложена такая. Опознается по нескольким точкам изображение символа и запоминается. Если далее встречается совпадающее (при анализе по этим же точкам) изображение, то оно вырезается, а на его место впоследствии будет подставлятся изображение запомненное в начале. Так со всеми символами. Чем больше символов совпало по изображению, тем меньше размер выходного файла DJVU.
Предположим, что анализ изображения происходит с разрешением 10 точек на мм
2. Тогда символ 5x5 мм будет анализироваться в 250 точках, а символ 3x3 мм - в 90 точках. Вот отсюда и неточное распознавание на мелких шрифтах. Надо повысить плотность анализа изображения... Тогда ошибки могут и исчезнуть. При этом время обработки исходных файлов увеличится, но размер файла DJVU увеличиться не должен.