OCR форумы Добро пожаловать, Гость. Пожалуйста, выберите Вход или Регистрация
Всем привет!
Hi all!
 
  ГлавнаяСправкаПоискВходРегистрация Администратор Библиотека  
 
Переключение на Главную Страницу Страниц: 1
Послать Тему Печать
Сканирование журналов (Прочитано 11679 раз)
Lykas
Патриарх
*****
Вне Форума


Всем привет!

Сообщений: 1073
Сканирование журналов
15.10.2005 :: 21:55:22
 
Есть мысль сделать из Библиотеки Ершова действительно Публичную Библиотеку, где бы находились не только книги, но и газеты, журналы. Начало этому процессу положено. Начали выкладываться «Техника молодежи» ; “Приложение к ЮТ”. Появились на полках “Чудеса и приключения”, “Моделист конструктор”. В сети появился сайт с архивом “ЮТ”. Для меня для этой работы две причины. Ностальгия по детству  Вторая причина – отсутствие наличия старых журналов. Например, у нас в городке те же журналы НЖ, ТМ проблема купить, никто не хочет с ними расставаться. Да и на новые не сильно подписку оформлять получается, сильно дорого.
Журналы обрабатываются по сравнению с книгами долго. Есть отсканированные ТМ, НЖ. По мере обработки сканов будет выкладываться.
Методика работы простая. Ложу журнал без разборки на страницы, сверху прижимаю толстой книгой и сканирую.  
1.      Сканирование.
Сканирую FR режиме сканирования нескольких страниц. Настройки (опции): оттенки серого (для текста и ч/б фото, серые рисунки) и цветной (24-х битное изображение). Разрешение для сканирования – 300 DPI. Указываю область сканирования. Развороты не делю. Чисто тексты и ч/б рисунки сканирую в оттенках серого. От ч/б сканирования сильно падает качество последующего распознавания. В ч/б я сейчас не сканирую.
У сканера UMAX 3450 время  цикла ч/б – 20 сек, серого – 24 сек: не сильно отличается.
Сканирую через FR интерфейс; но перед сканированием через интерфейс FR вызываю интерфейс управления сканированием Vista Scan. Настраиваю для выбранного режима цвет белый, цвет черный: для ч/б – 40 черный и 140-220 белый в зависимости от цвета и качества бумаги. (Можно это и не делать, после на готовых изображениях это выравнивается. Но зачем делать лишние операции при обработке) Провожу одно сканирование  чтобы настройки сохранились.
И запускаю сканирование в FR. Если есть желание, то можно запустить распознавание в «фоновом режиме». При этом идет разворот страницы, разбивка на блоки и распознавание.
Наверх
« Последняя редакция: 15.01.2012 :: 23:10:56 от Dmitry7 »  
 
IP записан
 
Lykas
Патриарх
*****
Вне Форума


Всем привет!

Сообщений: 1073
Re: Клонирование журналов
Ответ #1 - 15.10.2005 :: 22:32:09
 
2.      После сканирования необходимо сохранить изображения.
Выделяем одну страницу, нажимаем Ctrl+A.
Файл/сохранить изображения как. Указываем папку сохранения и выбираем формат сохранения и цветность изображения. Желательно с компрессией без потерь PNG; TIFF не сжатый; JPG – в крайнем случае. От формата сохраненного файла зависит размер на диске. Получаем, например, формат А4 цветного изображения 300 DPI – исходный файл – 40 МБ. Сжатый PNG – 5 МБ. JPG – 1,5 МБ. Я обычно сохраняю в PNG (не хочу разбираться в форматах TIFF как они есть в FR), потом конвертирую в сжатый TIFF в ASDSee 3.
Наверх
 
 
IP записан
 
Lykas
Патриарх
*****
Вне Форума


Всем привет!

Сообщений: 1073
Re: Клонирование журналов
Ответ #2 - 15.10.2005 :: 22:44:16
 
3.      Подготовка к обработке.
В ASDSee устанавливаю миниатюры в 5 столбцов и проверяю через строчку. Например  номера страниц 4,14, 24. Если номера сбиты в порядке, то есть пропущенные или лишние. Лишние удаляем, недостающие досканируем, сразу конвертируем по формату, переименовываем. В конце просмотра выделяем все и переименовываем серию.
Наверх
 
 
IP записан
 
amyatishkin
Активист
***
Вне Форума


Всем привет!

Сообщений: 426
Re: Клонирование журналов
Ответ #3 - 15.10.2005 :: 22:56:40
 
Кстати, у журнала ЮТ (или ЮТ для умелых рук?) был сайт, на который они чего-то выкладывали. Но вот на сайты со старыми ЮТ они наехали и позакрывали.
Сейчас не знаю, какова ситуация - пару лет назад было.
Наверх
 
 
IP записан
 
Lykas
Патриарх
*****
Вне Форума


Всем привет!

Сообщений: 1073
Re: Клонирование журналов
Ответ #4 - 16.10.2005 :: 21:41:00
 
4. Обработка сканов.
Если разворот помещается на сканере предварительно можно разрезать на страницы SkanKromsatorом.
Быстрая обработка. В ASDSee. Для 3-ей:Выбираем файл. Редактировать. Обрезать. Установить белый, черный, отрегулировать гамму. Но не всегда хороший результат. Обрабатывается вся страница. Если есть рисунки или фотографии - трудно совместить качество текста и фотографий.
Качественная обработка.
а) В ASDSee. Но 5-ой. Редактировать. Обрезать.При необходимости првернуть. Дополнительные возможности: можно повернуть изображение на любой угол, а не только 90/180/270; отдельные пятна можно убрать "Волшебной палочкой"; есть возможность работать только с выделенными областями - первая выделяется по левой клавише мыши, остальные с нажатым Alt. Выделили все рисунки. Дали комманду "инвертировать выделение" - работаем чисто с текстом.Редактируем с помощью "уровней" или "экспозиции". Подобранные значения можно сохранить. Сбрасываем выделение. Обрабатываем рисунки.Каждый выделяем и отдельно обрабатываем. Пробуем работать с помощью гаммы, белого и черного; для начинающих - "автоуровни", гамму увеличить до максимума, "автоуровни". Смотрите сами на результат своей работы.
б) PhotoShop. Открываем файлы. При необходимости поворачиваем.(Удобнее чем в  ASDSee: инструмент "Выделение" - указываем начало и конец горизонтальной линии(в реальности а не на скане) - Изображение/трансформирмация/поворот при этом угол поворота выберется автоматически.). Обрезка. Выделение областей на фотографиях и изображениях. Для текста изменяем уровни белого, черного - для текста 160-220/40. Можно установить в окно с цифрами и колесиком мыши менять, следя за изображением. Для белого - до исчезновения цвета фона и просветки страницы. Для изображения - "Автоуровень",или сразу выставляем белый/черный (можно смотреть по диаграмме просмотра); гамму (смотрим по изображению - мой сканер затеняет изображение).
5. Кодируем. См форум Ершова.
Наверх
 
 
IP записан
 
monday2000
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 98
Пол: male
Re: Клонирование журналов
Ответ #5 - 15.11.2007 :: 14:05:45
 
Zmiy писал(а) 30.12.2005 :: 01:13:27:
А BookRestorer Вы смотрели? Там можно написать скрипты по разрезанию (crop) и повороту...
Допустим у Вас 100 графич.файлов. При этом в каждом файле 2 картинки строго в определенных местах (в одинаковых координатах) и одна картинкаА прямо расположена, а другая картинкаБ повернута.
Тогда делаете два скрипта - 1) вырезать; 2) вырезать и повернуть. Далее делаете проект, куда грузите свои файлы. Подключаете скрипт 1 и 2, выполняете скрипт1, сохраняете результат - картинкиА. Далее в проекте делаете откат, выполняете скрипт2, сохраняете результат - картинкиБ.
Кроме того в BookRestorer можно делать различные коррекции изображений - яркость, контрастность, чистку. И все это можно делать в скриптах.

По-моему, абсолютно нереально. Я только что заглянул в BookRestorer 4.1 - с целью посмотреть, что из себя представляет его Crop. М-да, ну и убоище... Оказывается, режущие красные линии там мышью не подвинешь на скане - а только через окошки с координатами можно двигать эти линии. Никуда не годится подобный Crop. Печаль

Есть ещё относительно новый софт от GMAP - Recogniform Image Processor, вот можно почитать описание к его 5-ой версии: http://www.recogniform.com/image-processing.htm .
Имеется вылеченная версия 4.5 - где брать, надеюсь, все догадаются... Улыбка
Я сам не пробовал - но может там быть некий пакетный Crop.
Единственно, чем мне этот софт не понравился - изображение моргает при скроллинге. Конечно, этим можно пренебречь - но как-то неприятно немного.
И ещё есть же вариант использования IrfanView для пакетного Crop'а - тут мне  объясняли http://publ.lib.ru/cgi/forum/YaBB.pl?num=1163187544/0 - но я это попробовал, и пришёл к неутешительному выводу, что подобный вариант практически нереален - рамка там не сохраняется, её не так просто настроить, надо нажимать кучу кнопок. Короче, нереально.
Также нереально ИМХО использовать самодельно-написанный пакетный Crop-скрипт в Фотошопе - довольно сложно, просто не хватает никакого терпения, чтобы разобраться с написанием такого скрипта, да и вообще как-то непонятно, как там его пользовать...
Наверх
« Последняя редакция: 15.11.2007 :: 14:16:51 от monday2000 »  
WWW  
IP записан
 
amyatishkin
Активист
***
Вне Форума


Всем привет!

Сообщений: 426
Re: Клонирование журналов
Ответ #6 - 16.11.2007 :: 07:23:02
 
monday2000 писал(а) 15.11.2007 :: 14:05:45:
Также нереально ИМХО использовать самодельно-написанный пакетный Crop-скрипт в Фотошопе - довольно сложно, просто не хватает никакого терпения, чтобы разобраться с написанием такого скрипта, да и вообще как-то непонятно, как там его пользовать...

Что-то я не понял, какие именно действия вам надо выполнить. Начало ветки пропало?
В Фотошопе особых проблем с написанием скриптов нет. Спрашивайте - мб что-то и удасться сообразить.
Наверх
 
 
IP записан
 
Переключение на Главную Страницу Страниц: 1
Послать Тему Печать