opliaboy
Постоялец
Вне Форума
Всем привет!
Сообщений: 76
|
Из справки DjvuOCR-ru.txt:
ВОЗМОЖНАЯ ПРОБЛЕМА при работе DjvuDecode: Под WinXP наблюдается иногда (очень редко) прекращение работы, программа стоит и ничего не делает, количество обработанных стрниц не меняется. Похоже, что это баг в DjvuDecode.exe. Опыт показывает, что DjvuDecode на самом деле создаёт соответствующую страницу (как файл TIF), но почему-то не заканчивает свою работу.
(примечание: есть очень похожая проблема с программой ddjvu под Linux! Причём эта проблема обостряется, если компьютер сильно загружен. Однако проблема решается, если перекомпилировать ddjvu с опцией --disable-threads.)
С этим можно боротся так: запоминаем имя последнего графического файла, созданного в "Output directory". Потом запускаем Task Manager, и убиваем процесс DjvuDecoder (не DjvuOCR!!!). Программа тогда продолжает работать. Потом, в конце, надо подправить получающийся ПРОЕКТ-файл. Об этом ниже, в разделе "структура ПРОЕКТ-файла".
-----------
Если в книге есть пустые страницы, или поврежденные страницы, программа DjvuOCR их пропускает, но отмечает в список, который можно посмотреть в конце процесса.
После завершения процесса появляется сообщение "Save project file?" и возможность записать всю информацию о декодированных книгах в файл. Этот файл и есть ПРОЕКТ-файл, который очень удобен для последующего внедрения ОCR-текста через меню "Batch mode OCR manager". ПРОЕКТ-файл можно сохранить и нажатием кнопки "Save as OCR project". -------------------------------------------------------------------------------- --------------- После описания структуры файла есть такой текст: Наконец, если надо исправить проблема, которая описана выше (под WinXP, незавершение выполнения DjvuDecoder), то надо сделать так:
Открываем проект-файл в текстовом редакторе; Находим группу, которой соответствует страница, имя которой записали; Удаляем эту страницу из misspages для этого файла (и саму команду misspages, если список пустой); Увеличиваем processed на 1; Сохраняем проект-файл.
|