OCR форумы Добро пожаловать, Гость. Пожалуйста, выберите Вход или Регистрация
Форум переведен из кодировки UTF-8 в кодировку WINDOWS-1251. По всем вопросам, связанным с кодировкой текста (появлением «кракозябр»), обращайтесь к Администратору.
The forum is translated from the UTF-8 encoding to the WINDOWS-1251 encoding. For all questions related to the encoding of the text (the appearance of 'krakozyabr'), please contact the Administrator.
 
  ГлавнаяСправкаПоискВходРегистрация Администратор Библиотека  
 
Переключение на Главную Страницу Страниц: 1
Послать Тему Печать
Школа OCR. Вычитка. (Прочитано 3817 раз)
Lykas
Гуру
****
Вне Форума


Всем привет!

Сообщений: 744
Школа OCR. Вычитка.
24.04.2005 :: 01:33:03
 
Предлагаю составить классификацию вычитки книг.
1. FR- вычитка. Достоинство - можно видеть исходный текст. Недостаток - не для всех книг годится. Например, попробуйте править индексы в химических формулах, если FR их поднимает на уровень строки.
2. Word - вычитка. Правка в текстовом редакторе. Достоинство - большие возможности форматирования. НО -требует оригинала книги или сканинг для решения спорных вопросов.
2.1 Только правка (F7). Не всегда корректно.
2.2  После 2.1 вылавливание ошибок. Например, разбивка слова на два.
3. Автоматическая вычитка. Программы для автоматического исправления ошибок.  
Наверх
« Последняя редакция: 15.01.2012 :: 22:47:54 от Dmitry7 »  
 
IP записан
 
Gautier
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 154
Re: Школа OCR Вычитка.
Ответ #1 - 26.04.2005 :: 16:15:44
 
Все указанное необходимо, но недостаточно для достижения нужного качества (хотя бы одной опечатки на печатный лист - бывший ГОСТ). Читай "Правила OCR 2005" (пишу не для рекламы), там частично все это отражено, в том числе и про автоматическую, и методика после OCR. А у Zmiy имеется еще огромный список полуавтоматического поиска неточных слов после OCR.
Единственный выход достижения "книжного" качества независимо от качества печати сканируемого - корректура глазами.
Наверх
 
 
IP записан
 
Инклер
Активист
***
Вне Форума



Сообщений: 212
Москва
Пол: male
Re: Школа OCR Вычитка.
Ответ #2 - 26.04.2005 :: 16:29:43
 
Согласен.
Об опечатках ходят легенды--возложил корову, ими называют книги--Библия убийц, и ну НИКАКАЯ распромудрая программа не сделает то, что сделает голова и разум.
Попой надо, и никуда не денешься, и нам это проклятое счастье от Гутенберга досталось. Дьявол опечатки...
Поэтому стоит ли мудрить и выдумывать классификации...
Наверх
« Последняя редакция: 27.04.2005 :: 07:44:28 от Инклер »  

...я их до сих пор  читать не устал--с детства знакомые книги...&&
 
IP записан
 
Переключение на Главную Страницу Страниц: 1
Послать Тему Печать