OCR форумы Добро пожаловать, Гость. Пожалуйста, выберите Вход или Регистрация
Форум переведен из кодировки UTF-8 в кодировку WINDOWS-1251. По всем вопросам, связанным с кодировкой текста (появлением «кракозябр»), обращайтесь к Администратору.
The forum is translated from the UTF-8 encoding to the WINDOWS-1251 encoding. For all questions related to the encoding of the text (the appearance of 'krakozyabr'), please contact the Administrator.
 
  ГлавнаяСправкаПоискВходРегистрация Администратор Библиотека  
 
Переключение на Главную Страницу Страниц: 1
Послать Тему Печать
Нужна ли тщательная вычитка для научно-техн. книг? (Прочитано 2593 раз)
Dmitry7
Модератор
*****
На Форуме


Соберем Серии "НВЖНиТ"!

Сообщений: 4313
Санкт-Петербург
Нужна ли тщательная вычитка для научно-техн. книг?
03.03.2012 :: 18:14:49
 


По-моему, тщательная вычитка важна только для худож. книг, а для научно-технических она потребует времени больше, чем обработка сканов.
Другая крайность - многие обработчики вообще не добавляют OCR-слой под девизом "никакой OCR лучше некачественного".

Лично я после распознавания большой книги убираю только заметные ляпы, и тщательно стараюсь вычитывать только аннотацию, содержание и список литературы. Ну, может еще названия разделов. Еще OCR, даже с ошибками, помогает в поиске нужных мест книги.

Вычитывать полностью нереально, а нужно ли на самом деле?
Ваше мнение?
Наверх
 

"Если хочешь сделать что-то хорошо, сделай это сам!"
332371574  
IP записан
 
pohorsky
Патриарх
*****
Вне Форума


Подключайтесь к проекту
"Вся МРБ"!!!

Сообщений: 5005
Москва
Пол: male
Re: Нужна ли тщательная вычитка для научно-техн. книг?
Ответ #1 - 03.03.2012 :: 18:27:43
 
Согласен на 100%
Наверх
 
 
IP записан
 
Jeffry
Постоялец
**
Вне Форума


Привет всем!

Сообщений: 74
Re: Нужна ли тщательная вычитка для научно-техн. книг?
Ответ #2 - 03.03.2012 :: 18:29:11
 
Я обычно проверяю несколько первых и последних страниц, иногда выборочно еще несколько в серединке.
Книги без ocr мне не нужны вовсе, поэтому такие у меня проходят только в папку - приемник, а потом уже с ocr - в соответствующую папку по тематике.   Книги я индексирую, это позволяет быстро находить литературу по интересующему меня вопросу.   В pdf-книгах качество ocr хуже, поэтому иногда преобразую их в djvu только ради ocr.
Порядок страниц книги и порядок страниц ocr могут не совпадать даже с FR 8.0, если были ошибки:
- в нумерации перед добавлением в пакет FR,
- скан не был добавлен в djvu из-за сбоя эдитора,
- FR не распознал страницу из-за сбоя.
Эти сбои нужно контролировать и добиться их устранения.
Наверх
 
 
IP записан
 
Вадим
Администратор
*****
Вне Форума


Всем привет!

Сообщений: 839
Россия
Пол: male
Re: Нужна ли тщательная вычитка для научно-техн. книг?
Ответ #3 - 03.03.2012 :: 18:45:37
 
Dmitry7 писал(а) 03.03.2012 :: 18:14:49:
По-моему, тщательная вычитка важна только для худож. книг, а для научно-технических она потребует времени больше, чем обработка сканов.
Другая крайность - многие обработчики вообще не добавляют OCR-слой под девизом "никакой OCR лучше некачественного".

Лично я после распознавания большой книги убираю только заметные ляпы, и тщательно стараюсь вычитывать только аннотацию, содержание и список литературы. Ну, может еще названия разделов. Еще OCR, даже с ошибками, помогает в поиске нужных мест книги.

Вычитывать полностью нереально, а нужно ли на самом деле?
Ваше мнение?


Полностью согласен.
Наверх
 
WWW  
IP записан
 
Владислав_72
Активист
***
Вне Форума



Сообщений: 210
Москва
Пол: male
Re: Нужна ли тщательная вычитка для научно-техн. книг?
Ответ #4 - 29.04.2012 :: 16:33:56
 
Художку надо конечно вычитывать всю (потому что она читается обычно полностью), а вот научную - смысма не вижу, поэтому согласен с вышеизложенными мнениями.
Наверх
 
 
IP записан
 
Переключение на Главную Страницу Страниц: 1
Послать Тему Печать