Есть такие сканы
http://vedomo.ru/1TEMP/Novie-skani-koda.zipКонтрольная сумма MD5 архива 0F26D7303986B4037BB81D270FDA3CFB
Около 146 мегабайт.
Это из книги Болезни органов живота. Алгоритмы дифференциальной диагностики, распознавания, тактики. Справочное программированное руководство для врачей с программой для компьютерной диагностики
Авторы: Наумов Вадим Леонидович , Мамиконян Рафаэл Самвелович , Наумов Леонид Борисович
Год выпуска:1990
Вариант после обработки ScanTailor
http://vedomo.ru/1TEMP/Novie-skani-koda-obrezano.zip~42,7 МБ
MD5 B6411303E9A7148FCE7B79EEF55BD323
После распознавания в Finereader получается вот так.
http://vedomo.ru/1TEMP/PDF-txt.zipВ разные версиях Finereader распознавание с обучением одинаково работает? Если для этого буду использовать 9 или 10 версию, то такой же результат получается, как и в 11 или 12?
Это на языке программирования Fortran+ (ранняя версия языка Fortran).
Планирую распознать, выставив в Finereader русский и английский язык и дополнительно в языках программирования Fortran. Нужно получить текст, максимально приближенный к оригиналу для создания на основе него и других, более простых для преобразования листингов, компьютерной программы после правки ошибок, появившихся при распознавании.
Бывает ли так, что если выставить языки английский и русский и не добавлять язык программирования, то код программы может распознаваться лучше, чем с добавлением его? По идее в Fortran ничего такого особенного нету, а возможно может исковеркать русские слова.
Мне кажется, что после обработки в ScanTailor сканы получаются недостаточно контрастные. Пробовать распознавать с обучением или лучше срочно изучить Scankromsator, чтобы в нём попытаться сделать более контрастные цветные сканы с оттенками серого?