OCR форумы Добро пожаловать, Гость. Пожалуйста, выберите Вход или Регистрация
Форум переведен из кодировки UTF-8 в кодировку WINDOWS-1251. По всем вопросам, связанным с кодировкой текста (появлением «кракозябр»), обращайтесь к Администратору.
The forum is translated from the UTF-8 encoding to the WINDOWS-1251 encoding. For all questions related to the encoding of the text (the appearance of 'krakozyabr'), please contact the Administrator.
 
  ГлавнаяСправкаПоискВходРегистрация Администратор Библиотека  
 
Переключение на Главную Страницу Страниц: 1
Послать Тему Печать
Новая версия DjvuOCR 2.4 beta, FRFGrab 1.14 beta (Прочитано 14292 раз)
gencho
Новичок
*
Вне Форума


Всем привет!

Сообщений: 6
Новая версия DjvuOCR 2.4 beta, FRFGrab 1.14 beta
04.07.2008 :: 01:15:45
 
На сайт http://djvuocr.ucoz.ru/ появилась новая версия этой проги, уже работающая с FineReader 9

Пока надо еще увеличить статистика, но впольне можно работать - я сам распознал около 14000 страниц, более 40 DJVU книг.
Наверх
« Последняя редакция: 15.01.2012 :: 23:13:22 от Dmitry7 »  
 
IP записан
 
pohorsky
Патриарх
*****
Вне Форума


Подключайтесь к проекту
"Вся МРБ"!!!

Сообщений: 5323
Москва
Пол: male
Re: Новая версия DjvuOCR 2.4 beta, FRFGrab 1.14 be
Ответ #1 - 04.07.2008 :: 17:36:54
 
Спасибо, Gencho!
Но первая попытка из FR9 оказалась неудачной.
Вот такая ошибка:
invalid FRF format
(7) offset=00000082

Буду пробовать дальше.
Наверх
 
 
IP записан
 
gencho
Новичок
*
Вне Форума


Всем привет!

Сообщений: 6
Re: Новая версия DjvuOCR 2.4 beta, FRFGrab 1.14 be
Ответ #2 - 04.07.2008 :: 18:40:04
 
Случается Улыбка Так давайте FRF на мыло, это то что мне надо сейчась.
Наверх
 
 
IP записан
 
pohorsky
Патриарх
*****
Вне Форума


Подключайтесь к проекту
"Вся МРБ"!!!

Сообщений: 5323
Москва
Пол: male
Re: Новая версия DjvuOCR 2.4 beta, FRFGrab 1.14 be
Ответ #3 - 08.07.2008 :: 17:52:46
 
МРБ-0209, Электронные лампы, Е.А.Левитин, 1954 год. 
2,7 МБ, 600 dpi                                                
Scan AAW         
Djvuing, OCR pohorsky

Добавлен текстовой слой с помощью FR9 и только что выложенной бета-версии программы Gencho - 6_DjvuOCR_2.4_bet 

http://stream.ifolder.ru/7243429
Наверх
 
 
IP записан
 
Dmitry7
Модератор
*****
Вне Форума


Соберем Серии "НВЖНиТ"!

Сообщений: 5086
Санкт-Петербург
Пол: male
Re: Новая версия DjvuOCR 2.4 beta, FRFGrab 1.14 beta
Ответ #4 - 08.01.2011 :: 12:02:13
 
gencho писал(а) 04.07.2008 :: 01:15:45:
На сайт http://djvuocr.ucoz.ru/ появилась новая версия этой проги, уже работающая с FineReader 9
Пока надо еще увеличить статистика, но впольне можно работать - я сам распознал около 14000 страниц, более 40 DJVU книг.

А как насчет FineReader 10 ?
Наверх
 

"Если хочешь сделать что-то хорошо, сделай это сам!"
332371574  
IP записан
 
mor
Патриарх
*****
Вне Форума



Сообщений: 1722
Пол: male
Re: Новая версия DjvuOCR 2.4 beta, FRFGrab 1.14 beta
Ответ #5 - 08.08.2012 :: 21:56:38
 
У кого-нибудь работает нормально DjVuOCR с FR9 build 882 или старше?   В этой сборке была добавлена поддержка китайского, и она мне нужна.
При попытке прошить OCR-слой выдает ошибку "Invalid FRF"
Наверх
 
 
IP записан
 
mor
Патриарх
*****
Вне Форума



Сообщений: 1722
Пол: male
Re: Новая версия DjvuOCR 2.4 beta, FRFGrab 1.14 beta
Ответ #6 - 13.08.2012 :: 08:45:36
 
Решил проблему по другому. Поставил FR11 в нем есть возможность сохранения результата в формат DjVu с OCR-слоем.
Из полученного DjVu извлекаем OCR слой с помощью DjVuOCR и записываем в свой вариант.
Наверх
 
 
IP записан
 
Dmitry7
Модератор
*****
Вне Форума


Соберем Серии "НВЖНиТ"!

Сообщений: 5086
Санкт-Петербург
Пол: male
Re: Новая версия DjvuOCR 2.4 beta, FRFGrab 1.14 beta
Ответ #7 - 13.08.2012 :: 19:08:09
 
mor писал(а) 13.08.2012 :: 08:45:36:
Решил проблему по другому. Поставил FR11 в нем есть возможность сохранения результата в формат DjVu с OCR-слоем.
Из полученного DjVu извлекаем OCR слой с помощью DjVuOCR и записываем в свой вариант.

насколько я помню, FR11  некорректно пишет OCR слой в djvu: в конце строк вставляются левые символы, пробелы. Хотя для китайского, возможно, это не имеет значения )
Наверх
 

"Если хочешь сделать что-то хорошо, сделай это сам!"
332371574  
IP записан
 
balik2
Активист
***
Вне Форума


Всем привет!

Сообщений: 217
Пол: male
Re: Новая версия DjvuOCR 2.4 beta, FRFGrab 1.14 beta
Ответ #8 - 15.08.2012 :: 20:28:47
 
в самой последней модификации файнридера .583 в конце, провели усоршенствование работы с текстовым слоем в djvu, теперь там выделяется слово, а не вся строка целиком, и лишние символы не ставятся
Наверх
 
 
IP записан
 
Dmitry7
Модератор
*****
Вне Форума


Соберем Серии "НВЖНиТ"!

Сообщений: 5086
Санкт-Петербург
Пол: male
Re: Новая версия DjvuOCR 2.4 beta, FRFGrab 1.14 beta
Ответ #9 - 10.02.2013 :: 21:57:03
 

Вопрос к тем, кто пользуется djvuOCR 2.4:

Программа некорректно работает, когда в файле есть абсолютно пустые листы. Она не создает для них файл для последующего распознавания в ФР8, и потом OCR слой при наложении на исходный файл сдвигается по страницам  на количествто пустых листов. Что делать в этом случае?

Не удалять же сначала пустые листы из распознаваемого файла, а потом вставлять их обратно на свои места....
Наверх
 

"Если хочешь сделать что-то хорошо, сделай это сам!"
332371574  
IP записан
 
Jeffry
Постоялец
**
Вне Форума


Привет всем!

Сообщений: 75
Re: Новая версия DjvuOCR 2.4 beta, FRFGrab 1.14 beta
Ответ #10 - 11.02.2013 :: 17:37:41
 
Всякий раз переписываю номера игнорируемых страниц и потом создаю их перед загрузкой в ФР.
Но они не всегда пустые, иногда формат не нравится.   Это приходится проверять. 
Бывает, что Эдитором страница извлекается, хотя djvuOCR ее пропускает (хотя чаще наоборот бывает).
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 4356
Екатеринбург
Пол: male
Re: Новая версия DjvuOCR 2.4 beta, FRFGrab 1.14 beta
Ответ #11 - 11.02.2013 :: 17:40:09
 
а pohorsky не по этой причине трилистник на пустых листах добавляет?
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
Вадим
Администратор
*****
Вне Форума


Всем привет!

Сообщений: 937
Россия
Пол: male
Re: Новая версия DjvuOCR 2.4 beta, FRFGrab 1.14 beta
Ответ #12 - 11.02.2013 :: 18:44:47
 
Ну а gencho напрямую написать нельзя? Он охотно отвечает.
Наверх
 
WWW  
IP записан
 
Dmitry7
Модератор
*****
Вне Форума


Соберем Серии "НВЖНиТ"!

Сообщений: 5086
Санкт-Петербург
Пол: male
Re: Новая версия DjvuOCR 2.4 beta, FRFGrab 1.14 beta
Ответ #13 - 11.02.2013 :: 19:33:36
 
Вадим писал(а) 11.02.2013 :: 18:44:47:
Ну а gencho напрямую написать нельзя? Он охотно отвечает.

можно его координаты в ЛС ?
Наверх
 

"Если хочешь сделать что-то хорошо, сделай это сам!"
332371574  
IP записан
 
Dmitry7
Модератор
*****
Вне Форума


Соберем Серии "НВЖНиТ"!

Сообщений: 5086
Санкт-Петербург
Пол: male
Re: Новая версия DjvuOCR 2.4 beta, FRFGrab 1.14 beta
Ответ #14 - 11.02.2013 :: 19:37:25
 
AAW писал(а) 11.02.2013 :: 17:40:09:
а pohorsky не по этой причине трилистник на пустых листах добавляет?

надо хотя бы микроскопическую точку в уголке ставить на пустых листах. тогда проблем нет. Проблемы только с чистейшими белыми листами
Наверх
 

"Если хочешь сделать что-то хорошо, сделай это сам!"
332371574  
IP записан
 
opliaboy
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 70
Re: Новая версия DjvuOCR 2.4 beta, FRFGrab 1.14 beta
Ответ #15 - 22.01.2015 :: 15:05:48
 
Написаны вспомогательные утилиты автоматизации пакетного распознавания, создана дополнительная справка DjvuOCR:
http://vedomo.ru/a/s/paketnaia/DjvuOCRspravka.html
Наверх
 
 
IP записан
 
AlVaKo
Активист
***
Вне Форума



Сообщений: 264
Алма-Ата
Пол: male
Re: Новая версия DjvuOCR 2.4 beta, FRFGrab 1.14 beta
Ответ #16 - 13.09.2016 :: 14:54:41
 
Dmitry7 писал(а) 10.02.2013 :: 21:57:03:
Вопрос к тем, кто пользуется djvuOCR 2.4:

Программа некорректно работает, когда в файле есть абсолютно пустые листы.  Что делать в этом случае?

Не удалять же сначала пустые листы из распознаваемого файла, а потом вставлять их обратно на свои места....


Для тех кто-то ещё использует FineReader 8.0. и DjvuOCR.

Немного "измененный" DjvuOCR

https://cloud.mail.ru/public/8Nhc/FHzZRjiPE

Взял за основу FineReader 8.0 и FRFgrab  от gencho.
Сделал свою оболочку вместо DjvuOCR, с несколько иной логикой работы.
Получил двух-кнопочное создание "слоя OCR" для djvu-файла.
Пустые страницы внутри djvu-файла не мешают распознаванию.

Проверял работу с "портабельной" версией FineReader 8.0.
Предупреждаю, программа сырая.
Наверх
 

Сложно отбинаризировать черную перемычку на белой бумаге, особенно если её там нет.
 
IP записан
 
Dmitry7
Модератор
*****
Вне Форума


Соберем Серии "НВЖНиТ"!

Сообщений: 5086
Санкт-Петербург
Пол: male
Re: Новая версия DjvuOCR 2.4 beta, FRFGrab 1.14 beta
Ответ #17 - 13.09.2016 :: 18:41:26
 
AlVaKo писал(а) 13.09.2016 :: 14:54:41:
Для тех кто-то ещё использует FineReader 8.0. и DjvuOCR.
Немного "измененный" DjvuOCR
Пустые страницы внутри djvu-файла не мешают распознаванию.
Проверял работу с "портабельной" версией FineReader 8.0.
Предупреждаю, программа сырая.

спасибо! опробуем
Наверх
 

"Если хочешь сделать что-то хорошо, сделай это сам!"
332371574  
IP записан
 
Переключение на Главную Страницу Страниц: 1
Послать Тему Печать