OCR форумы Добро пожаловать, Гость. Пожалуйста, выберите Вход или Регистрация
Форум переведен из кодировки UTF-8 в кодировку WINDOWS-1251. По всем вопросам, связанным с кодировкой текста (появлением «кракозябр»), обращайтесь к Администратору.
The forum is translated from the UTF-8 encoding to the WINDOWS-1251 encoding. For all questions related to the encoding of the text (the appearance of 'krakozyabr'), please contact the Administrator.
 
  ГлавнаяСправкаПоискВходРегистрация Администратор Библиотека  
 
Страниц: 1 2 
Послать Тему Печать
Вышел ABBYY FineReader 11 (Прочитано 15817 раз)
Dmitry7
Модератор
*****
На Форуме


Соберем Серии "НВЖНиТ"!

Сообщений: 4315
Санкт-Петербург
Вышел ABBYY FineReader 11
04.03.2012 :: 15:21:42
 


Оказывается в новой версии можно загружать djvu файлы, распознавать их и сохранять обратно вместе с OCR.

Только надо в настройках сохранения djvu указать "качество изображений - пользовательское, разрешение - исходное, не менять цветность, потеря качества запрещена"


Наверх
« Последняя редакция: 04.03.2012 :: 16:12:35 от Dmitry7 »  

"Если хочешь сделать что-то хорошо, сделай это сам!"
332371574  
IP записан
 
Dmitry7
Модератор
*****
На Форуме


Соберем Серии "НВЖНиТ"!

Сообщений: 4315
Санкт-Петербург
Re: Вышел ABBYY FineReader 11
Ответ #1 - 04.03.2012 :: 15:26:39
 

также сохранять можно и в PDF с наложенным текстом

правда, размер становится больше
Наверх
 

"Если хочешь сделать что-то хорошо, сделай это сам!"
332371574  
IP записан
 
Dmitry7
Модератор
*****
На Форуме


Соберем Серии "НВЖНиТ"!

Сообщений: 4315
Санкт-Петербург
Re: Вышел ABBYY FineReader 11
Ответ #2 - 04.03.2012 :: 15:33:30
 


В FB2 тоже сохраняет, но там надо настройки изучать

Наверх
« Последняя редакция: 04.03.2012 :: 16:14:22 от Dmitry7 »  

"Если хочешь сделать что-то хорошо, сделай это сам!"
332371574  
IP записан
 
nbl
Гуру
****
Вне Форума



Сообщений: 502
Кузбасс
Пол: male
Re: Вышел ABBYY FineReader 11
Ответ #3 - 04.03.2012 :: 16:36:09
 
Сохранение в fb2 надо дорабатывать. Я пришел к выводу, что лучше сохранить в txt, а потом сделать copy-paste из текстового редактора в FictionBook Editor.
Наверх
 
 
IP записан
 
Dmitry7
Модератор
*****
На Форуме


Соберем Серии "НВЖНиТ"!

Сообщений: 4315
Санкт-Петербург
Re: Вышел ABBYY FineReader 11
Ответ #4 - 04.03.2012 :: 17:19:55
 
nbl писал(а) 04.03.2012 :: 16:36:09:
Сохранение в fb2 надо дорабатывать. Я пришел к выводу, что лучше сохранить в txt, а потом сделать copy-paste из текстового редактора в FictionBook Editor.

а как (правильно ли?) обрабатываются мягкие переносы, которые генерит FR  ?
Наверх
 

"Если хочешь сделать что-то хорошо, сделай это сам!"
332371574  
IP записан
 
pohorsky
Патриарх
*****
Вне Форума


Подключайтесь к проекту
"Вся МРБ"!!!

Сообщений: 5005
Москва
Пол: male
Re: Вышел ABBYY FineReader 11
Ответ #5 - 04.03.2012 :: 17:34:58
 
Dmitry7 писал(а) 04.03.2012 :: 15:21:42:
Оказывается в новой версии можно загружать djvu файлы, распознавать их и сохранять обратно вместе с OCR.

Только надо в настройках сохранения djvu указать "качество изображений - пользовательское, разрешение - исходное, не менять цветность, потеря качества запрещена"


Попробовал - пишет "Внутренняя ошибка модуля поддержки формата djvu..."
Наверх
 
 
IP записан
 
Dmitry7
Модератор
*****
На Форуме


Соберем Серии "НВЖНиТ"!

Сообщений: 4315
Санкт-Петербург
Re: Вышел ABBYY FineReader 11
Ответ #6 - 04.03.2012 :: 17:54:03
 
pohorsky писал(а) 04.03.2012 :: 17:34:58:
Попробовал - пишет "Внутренняя ошибка модуля поддержки формата djvu..."


нет, у меня без ошибок. (win xp sp3)
Наверх
 

"Если хочешь сделать что-то хорошо, сделай это сам!"
332371574  
IP записан
 
nbl
Гуру
****
Вне Форума



Сообщений: 502
Кузбасс
Пол: male
Re: Вышел ABBYY FineReader 11
Ответ #7 - 04.03.2012 :: 18:40:38
 
Dmitry7 писал(а) 04.03.2012 :: 17:19:55:
а как (правильно ли?) обрабатываются мягкие переносы, которые генерит FR  ?

При сохранении в txt мягкие переносы убираются, т.е. части слова склеиваются в целое слово.
Наверх
 
 
IP записан
 
Dmitry7
Модератор
*****
На Форуме


Соберем Серии "НВЖНиТ"!

Сообщений: 4315
Санкт-Петербург
Re: Вышел ABBYY FineReader 11
Ответ #8 - 05.03.2012 :: 22:27:30
 

Поработал некоторое время с FR11.

Что заметил:

1. плюсы: при копировании текста выделением из djvu предложения не разрываются концами строк, в целом качество распознавания выше
2. минусы:  файл становится гораздо больше размером, чуть ли не 2 раза (возможно, это связано с другой степенью сжатия djvu в отличие от исходного файла). Но, может быть, это как-то возможно настроить
Наверх
 

"Если хочешь сделать что-то хорошо, сделай это сам!"
332371574  
IP записан
 
sergiokapone
Постоялец
**
Вне Форума



Сообщений: 71
Пол: male
Re: Вышел ABBYY FineReader 11
Ответ #9 - 12.04.2012 :: 16:27:58
 
Dmitry7 писал(а) 05.03.2012 :: 22:27:30:
1. плюсы: при копировании текста выделением из djvu предложения не разрываются концами строк, в целом качество распознавания выше2. минусы:  файл становится гораздо больше размером, чуть ли не 2 раза (возможно, это связано с другой степенью сжатия djvu в отличие от исходного файла). Но, может быть, это как-то возможно настроить


Еще один минус: при поиске в djvu выделяется не поисковое слово, а целая строка, содержащая слово.  Из-за такого недодела я еще распознаю FR8.
Наверх
 
 
IP записан
 
Dmitry7
Модератор
*****
На Форуме


Соберем Серии "НВЖНиТ"!

Сообщений: 4315
Санкт-Петербург
Re: Вышел ABBYY FineReader 11
Ответ #10 - 12.04.2012 :: 19:40:56
 
еще минус - добавляются непонятные значки вместо пробелов...

вернулся к 8-й версии. Хороша она всё-таки!
Наверх
 

"Если хочешь сделать что-то хорошо, сделай это сам!"
332371574  
IP записан
 
Dmitry7
Модератор
*****
На Форуме


Соберем Серии "НВЖНиТ"!

Сообщений: 4315
Санкт-Петербург
Re: Вышел ABBYY FineReader 11
Ответ #11 - 12.04.2012 :: 19:42:56
 
sergiokapone писал(а) 12.04.2012 :: 16:27:58:
Еще один минус: при поиске в djvu выделяется не поисковое слово, а целая строка, содержащая слово.  Из-за такого недодела я еще распознаю FR8.


если сохранять в PDF/А , то такого недостатка нету вроде бы.


и еще из минусов - портятся серые и цветные картинки.
Наверх
 

"Если хочешь сделать что-то хорошо, сделай это сам!"
332371574  
IP записан
 
sergiokapone
Постоялец
**
Вне Форума



Сообщений: 71
Пол: male
Re: Вышел ABBYY FineReader 11
Ответ #12 - 12.04.2012 :: 20:04:27
 
Dmitry7 писал(а) 12.04.2012 :: 19:42:56:
если сохранять в PDF/А , то такого недостатка нету вроде бы.

Такое только в djvu.
Наверх
 
 
IP записан
 
Dmitry7
Модератор
*****
На Форуме


Соберем Серии "НВЖНиТ"!

Сообщений: 4315
Санкт-Петербург
Re: Вышел ABBYY FineReader 11
Ответ #13 - 24.04.2012 :: 20:05:58
 
обсуждение багов при сохранении в djvu на форуме ABBYY

http://finereader.abbyy.ru/forum/actualthread.aspx?bid=7&tid=1201&pg=-1#last
Наверх
 

"Если хочешь сделать что-то хорошо, сделай это сам!"
332371574  
IP записан
 
Dmitry7
Модератор
*****
На Форуме


Соберем Серии "НВЖНиТ"!

Сообщений: 4315
Санкт-Петербург
Re: Вышел ABBYY FineReader 11
Ответ #14 - 19.08.2012 :: 09:30:13
 


Пробовал распознавать и сохранять FR11 и FR8+djvuOCR в DJVU:


1. Распознавание и сохранение в DJVU новым FR11 11.0.102.583:
- в концах строк нет пробелов, переносы сохраняются как "мягкие переносы", а не дефисами. Поэтому при копировании из djvu в текстовый файл переносы выглядят  закорючками, что плохо.
- 2-й недостаток - размер файл увеличивается гораздо больше, чем при использовании FR8

2. Распознавание FR11, затем вытаскивание OCR слоя  и запись в файл уже с помощью djvuOCR:
- размер удалось уменьшить, но появляются пробелы в концах строк, и вместо некоторых одиночных пробелов появляются по 2-3.
- также остаются закорючки вместо переносов-дефисов

3. Распознавание FR8 и запись с помощью djvuOCR:
- размер минимальный
- переносы выглядят как дефисы, но
- в концах строк есть пробелы (ненужные)
- нет поддержки греческих букв.


Поэтому решил оставаться пока на FR8, и применять FR11 только для книг с большим количеством греческих букв.


Кто знает, как сделать, чтобы в djvu-файл FR11 писал переносы в виде дефисов, а не закорючек -"мягких переносов" ??
И почему размер файла увеличивается, когда я в настройках указал - не менять качество исходного файла??


nbl писал(а) 04.03.2012 :: 18:40:38:
При сохранении в txt мягкие переносы убираются, т.е. части слова склеиваются в целое слово.


если копировать из djvu в TXT, то не убираются  ((
Наверх
« Последняя редакция: 19.08.2012 :: 09:52:37 от Dmitry7 »  

"Если хочешь сделать что-то хорошо, сделай это сам!"
332371574  
IP записан
 
mor
Патриарх
*****
Вне Форума



Сообщений: 1626
Пол: male
Re: Вышел ABBYY FineReader 11
Ответ #15 - 19.08.2012 :: 22:14:36
 
Dmitry7
В FR8 есть греческий язык.

Устанавливается отдельно, для разных сборок разные пакеты, например для моей версии:
http://www.abbyy.com/addlang/build8001126/?lang=ru
Наверх
 
 
IP записан
 
Dmitry7
Модератор
*****
На Форуме


Соберем Серии "НВЖНиТ"!

Сообщений: 4315
Санкт-Петербург
Re: Вышел ABBYY FineReader 11
Ответ #16 - 20.08.2012 :: 19:05:44
 
mor писал(а) 19.08.2012 :: 22:14:36:
Dmitry7
В FR8 есть греческий язык.

Устанавливается отдельно, для разных сборок разные пакеты, например для моей версии:
http://www.abbyy.com/addlang/build8001126/?lang=ru

у меня FR8 8.0.0.731 portable. для него не нашел греческого языка (не хватает файла "greek.amt")
Наверх
« Последняя редакция: 20.08.2012 :: 22:12:49 от Dmitry7 »  

"Если хочешь сделать что-то хорошо, сделай это сам!"
332371574  
IP записан
 
Jeffry
Постоялец
**
Вне Форума


Привет всем!

Сообщений: 74
Re: Вышел ABBYY FineReader 11
Ответ #17 - 20.08.2012 :: 21:03:18
 
Greek_for_FR8.rar.html
- у меня для ФР-8.0 хорошо работает
Наверх
 
 
IP записан
 
GMAP
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 50
Somewhere there...
Пол: male
Re: Вышел ABBYY FineReader 11
Ответ #18 - 21.08.2012 :: 11:18:12
 
Dmitry7 писал(а) 20.08.2012 :: 19:05:44:
не хватает файла "greek.amt"

Нужно запустить TrigrammInstaller.exe для создания amt файлов при добавлении языков. Если сборка ThinApp или Spoon Studio, то запускать в виртуальной среде.
Наверх
 
 
IP записан
 
Dmitry7
Модератор
*****
На Форуме


Соберем Серии "НВЖНиТ"!

Сообщений: 4315
Санкт-Петербург
Re: Вышел ABBYY FineReader 11
Ответ #19 - 21.08.2012 :: 18:41:31
 
GMAP писал(а) 21.08.2012 :: 11:18:12:
Нужно запустить TrigrammInstaller.exe для создания amt файлов при добавлении языков. Если сборка ThinApp или Spoon Studio, то запускать в виртуальной среде.

спасибо! всё заработало
Наверх
 

"Если хочешь сделать что-то хорошо, сделай это сам!"
332371574  
IP записан
 
GMAP
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 50
Somewhere there...
Пол: male
Re: Вышел ABBYY FineReader 11
Ответ #20 - 22.08.2012 :: 08:28:08
 
Вчера обновил свою портабельную сборку FR8 с 731 до 1126, других уже не было, языки русский-английский-греческий, остальные добавляются по вкусу, размер 48 метров. Кому интересно, пишите в ЛС.
Наверх
 
 
IP записан
 
Вадим
Администратор
*****
Вне Форума


Всем привет!

Сообщений: 839
Россия
Пол: male
Re: Вышел ABBYY FineReader 11
Ответ #21 - 25.08.2012 :: 07:45:13
 
Посмотрел я FR11.
Для меня в нем есть один недостаток, который делает его для меня малопригодным.
FR11 работает и с PDF и с DJVU файлами. Но при открытии этих файлов необходимо загружать их либо целиком, что очень долго при наличии нескольких сот страниц, либо прописывать вручную номера требуемых для загрузки страниц в специальном поле, что совершенно неудобно. При этом в окне загрузки файлов, справа, есть окошко предпросмотра, в котором отбражаются все страницы документа с их порядковыми номерами. Почему же прописывать эти номера нужно вручную? Почему они не заносятся автоматически в то самое поле с номерами загружаемых страниц при двойном клике на выбранной странице? Мелочь, а работать неудобно!
Наверх
 
WWW  
IP записан
 
Dmitry7
Модератор
*****
На Форуме


Соберем Серии "НВЖНиТ"!

Сообщений: 4315
Санкт-Петербург
Re: Вышел ABBYY FineReader 11
Ответ #22 - 25.08.2012 :: 18:05:44
 
Вадим писал(а) 25.08.2012 :: 07:45:13:
Посмотрел я FR11.
Для меня в нем есть один недостаток, который делает его для меня малопригодным.
FR11 работает и с PDF и с DJVU файлами. Но при открытии этих файлов необходимо загружать их либо целиком, что очень долго при наличии нескольких сот страниц, либо прописывать вручную номера требуемых для загрузки страниц в специальном поле, что совершенно неудобно. При этом в окне загрузки файлов, справа, есть окошко предпросмотра, в котором отбражаются все страницы документа с их порядковыми номерами. Почему же прописывать эти номера нужно вручную? Почему они не заносятся автоматически в то самое поле с номерами загружаемых страниц при двойном клике на выбранной странице? Мелочь, а работать неудобно!

а в FR8 по-другому?
Наверх
 

"Если хочешь сделать что-то хорошо, сделай это сам!"
332371574  
IP записан
 
Вадим
Администратор
*****
Вне Форума


Всем привет!

Сообщений: 839
Россия
Пол: male
Re: Вышел ABBYY FineReader 11
Ответ #23 - 25.08.2012 :: 18:25:21
 
Dmitry7 писал(а) 25.08.2012 :: 18:05:44:
а в FR8 по-другому?

Не проверял. Я до сих пор пользуюсь FR7. Он быстро грузится и быстро распознает. Качество распознавания, для моих целей, меня вполне устраивает. В более поздних версиях возможностей стало намного больше, но я, полезных лично для меня, не нахожу.
Наверх
 
WWW  
IP записан
 
imwerden
Новичок
*
Вне Форума



Сообщений: 32
Мюнхенъ
Пол: male
Re: Вышел ABBYY FineReader 11
Ответ #24 - 04.09.2012 :: 11:53:06
 
Я позволил себе даже купить файнридер. Сначала 9 версию, потом ее абгрейдил до 11. Получилось в два раза дешевле и имею две версии. 11 намного быстрее работает!! Улучшен модуль редактирования изображений. Словарь для старой орфографии загрузился целиком (насколько помню - давно уже это было).
Наверх
 

Электронная библиотека ImWerden&&http://imwerden.de
WWW  
IP записан
 
bookserg
Новичок
*
Вне Форума


Всем привет!

Сообщений: 1
Москва
Пол: male
Re: Вышел ABBYY FineReader 11
Ответ #25 - 09.01.2013 :: 18:05:18
 
imwerden писал(а) 04.09.2012 :: 11:53:06:
Словарь для старой орфографии загрузился целиком (насколько помню - давно уже это было).

А насчет словаря для старой орфографии можно подробнее?
Чья разработка? Где взять?

Наверх
 
 
IP записан
 
Dmitry7
Модератор
*****
На Форуме


Соберем Серии "НВЖНиТ"!

Сообщений: 4315
Санкт-Петербург
Re: Вышел ABBYY FineReader 11
Ответ #26 - 12.01.2013 :: 22:19:35
 
для FR8 тут:
http://www.abbyy.com/DLCenter/downloadcentermanager.aspx?file=/fr80/AddRecLang/O...


файлы с названиями rusOS*
Наверх
 

"Если хочешь сделать что-то хорошо, сделай это сам!"
332371574  
IP записан
 
antoniol
Новичок
*
Вне Форума


Урааа

Сообщений: 1
Re: Вышел ABBYY FineReader 11
Ответ #27 - 22.05.2013 :: 11:33:07
 
кто нибудь может дать ссылку на бесплатный файнридер? заранее спасибо
Наверх
 

Скромно излагаю свои мысли о стройке и ремонте вот здесь
WWW  
IP записан
 
Kis
Активист
***
Вне Форума



Сообщений: 422
Россия, Москва
Пол: male
Re: Вышел ABBYY FineReader 11
Ответ #28 - 22.05.2013 :: 12:04:50
 
@
antoniol

Клик!
Наверх
 
 
IP записан
 
romulus
Новичок
*
Вне Форума


Всем привет!

Сообщений: 8
Re: Вышел ABBYY FineReader 11
Ответ #29 - 06.02.2014 :: 14:48:18
 
Друзья, счас можно юзать любую доступную прогу - от FR Scripting Edition do FR 11 Corporate, a также OmniPage 16.-19., Readiris 14., etc.
Ранее сканировал сам, по примерно 100К в год, но
теперь в  о с н о в н о м  юзаю готовые сканы гугла.
Их теперь юзают и госбиблиотеки (в Германии).
Отсюда вопрос:
Какая прога лучше всего распознает?
Гугл использует FR8.
Я перепроверил на  с л о ж н о м  скане не лучшего качества (sic!важно!) - на развороте 4 столбца, 2 шрифта по жирности, 2 типа шгрифта по засечкам, верхние и нижние колонтитулы -
FR7, FR8 , FR9, FR10, FR11, OP 16, OP18, OP19, Readiris14
Результаты:
Лучшее распознавание с учетом сохранения форматирования 1 к 1 -
FR8.

ОР при сохранении форматирования в более узких пределах белесости/темноты сканов чувствительны к качеству этих сканов (может распознать весь разворот как bold при темноватом скане). Но скан А4 остается А4 при сохранении.
FR9-11 - полный развал форматирования, А4 распознает в А3, шрифт вместо 8 дает 8,5 при этом автоматом, хотя в таблице стилей пишет 8. Не различает на одной странице Arial + Times New Roman.
Readiris14 - хуже всех
FR7 Scripting Edition для готики - без вариантов!
Наверх
« Последняя редакция: 06.02.2014 :: 15:07:08 от romulus »  
 
IP записан
 
Страниц: 1 2 
Послать Тему Печать