OCR форумы Добро пожаловать, Гость. Пожалуйста, выберите Вход или Регистрация
Всем привет!
Hi all!
 
  ГлавнаяСправкаПоискВходРегистрация Администратор Библиотека  
 
Переключение на Главную Страницу Страниц: 1
Послать Тему Печать
Чем сканить? FineReader или чем-то другим? (Прочитано 9582 раз)
kontiky
Новичок
*
Вне Форума


Всем привет!

Сообщений: 13
Пол: male
Чем сканить? FineReader или чем-то другим?
14.12.2005 :: 15:30:04
 
Вот тут у меня вопрос возник - всю жизнь сканил и распознавал в FR и тут услышал что люди сканят в чем-то другом, а потом уже только распознают в FB.
Какой смысл? Что это дает?

PS Я не делаю книг в djvu. Речь идет именно о скннировании для распознавания дальнейшего.
Наверх
 
WWW  
IP записан
 
amyatishkin
Активист
***
Вне Форума


Всем привет!

Сообщений: 426
Re: Чем сканить? FineReader или чем-то другим?
Ответ #1 - 14.12.2005 :: 19:27:06
 
Если в книге много фотографий/рисунков, то можно сканировать через левую программу и программу сканирования. У меня это обычно ACDSee 3.1+ и драйвер сканера. Сканируется в ТИФФ без сжатия (8 или 24 битный), 300 дпи.

(Необходимо оговорить, что обычно книги мне приходиться делать как текст+ список рисунков в хтмл+рисунки.)

После сканирования эти тиффы загоняются в ФР (обычно как b/w).

Плюсы -
1)то, что рисунки не портятся ФР,
2)можно сделать пакетную обработку Фотошопом, чтобы поправить яркость, например где белая просвечивающая бумага
3)бывают книги с серой бумагой, где ФР разворот пытается закрасить черным*
4)книги с мелким текстом - можно в том же Фотошопе всё увеличить раза в полтора (с 300 дпи), на обычном тексте это никак не скажется, а мелкий будет замечательно распознаваться
5)всякие объемные, размером с энциклопудию какую - удобнее спокойно перевернуть и кнопку нажать**
6)У меня часть книг попадает до 1950 года - их хочется сохранять в наилучшем качестве.
7)А часть этих книг с пометками красным карандашом :-|

*)В последнее время придумалось ноу-хау для серой бумаги. Если поля широкие, то можно стекло сканера на месте переплета заклеить полоской черной изоленты ПХВ. ФР тогда сумеет отделить цвет бумаги от черного.
**)Опять же для меня  - Или я сканирую в ФР на автомате, только переворачивая книжку, или через драйвер - перелистнул, нажал кнопку.

По скорости - надо замерять. У меня ФР на старом сканере стабильно выдавал в автоматическом b/w 200 стр. на всех компах, через драйвер шло медленнее, но после установке Атлона ХП через драйвер скорость получалась 220 стр/час.
Наверх
 
 
IP записан
 
kontiky
Новичок
*
Вне Форума


Всем привет!

Сообщений: 13
Пол: male
Re: Чем сканить? FineReader или чем-то другим?
Ответ #2 - 15.12.2005 :: 16:03:56
 
А можно поподробнее, по шага, как делается
4)книги с мелким текстом - можно в том же Фотошопе всё увеличить раза в полтора (с 300 дпи), на обычном тексте это никак не скажется, а мелкий будет замечательно распознаваться
?
Наверх
 
WWW  
IP записан
 
amyatishkin
Активист
***
Вне Форума


Всем привет!

Сообщений: 426
Re: Чем сканить? FineReader или чем-то другим?
Ответ #3 - 16.12.2005 :: 07:44:47
 
kontiky писал(а) 15.12.2005 :: 16:03:56:
А можно поподробнее, по шага, как делается

?


В фотошопе. Создается действие с увеличением на 150%, потом пакетная обработка - выбирается это действие, папка с файлами, результирующая папка.

В принципе, большинство и простых бесплатных програмок типа IrfanView, XnView такое умеют. Но там малость сложнее в настройках.
Наверх
 
 
IP записан
 
genm
Новичок
*
Вне Форума



Сообщений: 1
Пол: male
Re: Чем сканить? FineReader или чем-то другим?
Ответ #4 - 17.12.2005 :: 18:52:32
 
Да, действительно ресемплинг в большее разрешение сохраняет кучу времени. Я например и сканю и ресемплю в XnView. В IrfanView при пакетном сканировании окно драйвера терят фокус после каждого скана, а в XnView все в порядке. А ресемплинг делаю так, например надо с 300 сделать 400, в окне драйвера просто выбираешь разрешение 400 и смотришь какие размеры примет скан. Заходишь в XnView выбираешь все сканы и по правой мыши Batch Convert. Там ресайз Lancroz'ом, после этого Sharpen (для варианта 400dpi беру 30), потом если скан серый Convert to Grayscale (например 256, dithered) т.к. после ресайза 16M цветов. При ресемплинге в большее разрешение резкости добавляем по вкусу.
Наверх
 
 
IP записан
 
Mutante
Новичок
*
Вне Форума


Всем привет!

Сообщений: 2
Re: Чем сканить? FineReader или чем-то другим?
Ответ #5 - 30.10.2007 :: 16:20:46
 
Год работал на скане HP с прогой FR-6.  При сканере были программы Image Zone  и Директор HP. Через год Имадж потребовал обновлений и сканер перестал работать.Комп его не узнавал. Загрузить обновление полез -не потянуло,там все иностранное,а у меня дема. Затем сканер умер. Не помогало ничего.Я помучался и снес напрочь Имаджу Зону и теперь сканирую книги в Мастере скана,открываю с помощью Microsoft Office Document Imaging,откуда переправляю в Ворд.Раньше жал три кнопки и все было в Ворде.Теперь этот же путь в двадцать четыре кнопки. При чем здесь  Fein reader -6 не возьму в толк? Может и без нее все путем? Посоветуйте,как быть,сканировать до ужаса,а на каждый лист по двадцать жамков,мышь сдохнет...    Ужас
Наверх
 
 
IP записан
 
MT
Новичок
*
Вне Форума


Всем привет!

Сообщений: 19
Re: Чем сканить? FineReader или чем-то другим?
Ответ #6 - 13.11.2007 :: 23:37:13
 
Переходите на FineReader 9, и будет вам счастье!
Наверх
 
 
IP записан
 
monday2000
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 98
Пол: male
Re: Чем сканить? FineReader или чем-то другим?
Ответ #7 - 11.12.2007 :: 12:35:22
 
Сканировать лучше всего при помощи Irfan View. В будущей версии (которая будет после 4.10) эта программа моими стараниями научилась не воровать фокус с окна сканерного драйвера при каждом акте отсканирования - что даёт возможность, выключив монитор, запускать очередной акт отсканирования просто нажатием клавиши "Пробел" - тогда как раньше приходилось это делать только мышкой при включённом мониторе.

Также можно использовать ABBYY FineReader 9 - но перед сканированием сбросьте там в опциях галку "Исправлять перекос страниц".
Наверх
 
WWW  
IP записан
 
Переключение на Главную Страницу Страниц: 1
Послать Тему Печать