OCR форумы Добро пожаловать, Гость. Пожалуйста, выберите Вход или Регистрация
Всем привет!
Hi all!
 
  ГлавнаяСправкаПоискВходРегистрация Администратор Библиотека  
 
Страниц: 1 2 
Послать Тему Печать
Предлагаю поделиться опытом (Прочитано 26382 раз)
nbl
Гуру
****
Вне Форума



Сообщений: 502
Кузбасс
Пол: male
Предлагаю поделиться опытом
11.05.2010 :: 09:59:30
 
Очень долго у меня лежали сканы статьи о первых ЭВМ БЭСМ из журнала. Сейчас поднакопилось опыта, и я попробовал эти сканы обработать. Хотелось бы услышать от коллег советы и рекомендации, как лучше и быстрее обрабатывать такого типа сканы.

Сырые сканы и мой результат можно взять здесь:
http://narod.ru/disk/20601509000/%D0%91%D0%AD%D0%A1%D0%9C.rar.html
Наверх
« Последняя редакция: 28.02.2012 :: 04:08:22 от nbl »  
 
IP записан
 
Kis
Активист
***
Вне Форума



Сообщений: 434
Россия, Москва
Пол: male
Re: Предлагаю поделиться опытом
Ответ #1 - 15.09.2010 :: 01:34:43
 
Первая делёжка. Улыбка
Недавно ben_hog попросил меня написать о том, как я кодирую в djvu растровые фотографии. Примеры результатов можно найти, например, здесь или здесь.
К дальнейшему тексту прилагаются иллюстрации на 30 мегабайт, которые можно скачать на rapidshare.com или ifolder.ru. Имена файлов, о которых ведется речь, даны в квадратных скобках (расширение tif я опустил).

Инструкция (проект)
1. Сканируем. Я это делаю на 600 dpi. [i4-0]
2. Загружаем сканы в ScanKromsator.
3. Нажимаем "Черновую расстановку резаков", при необходимости поправляем вручную результаты.
4. Вручную обводим все картинки и придаем им статус "picture zone".
5. Выставляем параметры обработки текста (Binarization, Grey Enhance и т.д.). Я выбрал такие: Binarization = MiddleDark, Enhance image = true, Smooth = 1, Blur = 0, Sharpen = 1, Grey Enhance = true, Correct Illumination = true, Adjust histogram = false, Method = Safe, Enhance Contour = Enable & Auto, остальное -- либо по умолчанию, либо не надо.
6. Нажимаем "Process" и ждем.
7. При необходимости поправляем вручную угол поворота и обрабатываем (Process left page, Process right page) еще раз такие страницы. Получаются отдельно файлы с текстом и с картинками [i4-1-text, i4-1-pict1, i4-1-pict2].
(Теперь начинается самое интересное...)
8. Картинки загружаем в растровый графический редактор (любой из более-менее серьезных: GIMP, Adobe Photoshop, Corel PhotoPaint, ... в общем, тот, к которому вы привыкли). Я привык к GIMP.
9. Filters -> Enhance -> Sharpen. Выбираем для Sharpness какое-нибудь достаточно большое значение (мне нравится 70) [m1], нажимаем OK. Сейчас я сохраню картинку для инструкции [i4-1-pict1-1, i4-1-pict2-1], но обычно я этого не делаю, а сразу перехожу к следующему пункту. (На полученной картинке виден муар, но как с ним бороться, я пока не знаю, иногда удается свести его к минимуму, подложив при сканировании под страницу черную-пречерную бумагу.)
10. Colors -> Curves. Выбираем кривую в виде ступеньки [m2]. Можно подвигать ступеньку за верхнюю и нижнюю точки влево-вправо, чтобы добиться наилучшей сочности картинки. Теперь картинка стала почти бинаризованной, так что остается закрепить это положение "юридически": Image -> Mode -> Indexed, Use black and white (1-bit) palette. Сохраняем картинку (можно сразу со сжатием "CCITT Group 4 fax" [i4-1-pict1-2, i4-1-pict2-2], желательно под другим именем, чтобы иметь возможность отката.
11. Теперь надо в графическом редакторе пройтись белой кисточкой по краю картинки (как в "текстовом" файле, так и в "картиночных"): там после бинаризации могут остаться артефактные точки. [i4-2-text, i4-2-pict1, i4-2-pict2]. Во многих случаях результат можно проверить при помощи IrfanView: надо загрузить в него получившиеся файлы и сделать Auto Crop Borders (Ctrl+Shift+Y), после чего изображения должны обрезаться строго до размеров текста/картинки (если не уменьшились, то надо искать оставшиеся артефактные точки).
12. Подсовываем сделанные файлы обратно в ту папку, в которой с ними работает ScanKromsator (с изначальными именами, конечно).
13. Возвращаемся в ScanKromsator, делаем картинкам Merge и сохраняем результат. [i4-result]
14. Кодируем этот результат в djvu с профилем bitonal. [i4-result.djvu]

Это и есть тот максимум, который я могу выжимать из растровых фотографий. Наверняка что-то можно улучшить (а может, надо все делать совсем не так). Особенно мне не нравится муар. Наверное, он возникает по самым разным причинам (изначальное присутствие в бумажном исходнике, железо и/или софт сканера, фильтры графического редактора, кодер djvu, программа-просмотрщик, отображение на "крупноточечном" экране компьютера). По-моему, последняя причина вносит самый "тяжелый" вклад в появление муара. А может, и еще что-то влияет.
Но результат мне в целом нравится. Так над изначально "запорченной" растром в издательстве аналоговой фотографией не производится еще одна "порча" -- размытие.
Еще я подозреваю, что все эти операции можно проделать в СканКромсаторе, но в нем визуальный контроль этапов обработки (для меня) неочевиден.
Критика, замечания и улучшения, а также совсем другие инструкции, приводящие к хорошим результатам, приветствуются.
P.S. Книга будет попозже, когда я сделаю, проверю и перепроверю остальные картинки. На самом деле она (И.П. Вейнберг, "Человек в культуре древнего Ближнего Востока") в интернете уже есть, вот только картинки и обложка там в лучшем случае на четверочку с минусом, а текст очень неплохо сделан, и я его переделывать не планирую.
Наверх
 
 
IP записан
 
ben_hog
Новичок
*
Вне Форума


Всем привет!

Сообщений: 31
Re: Предлагаю поделиться опытом
Ответ #2 - 26.09.2010 :: 00:29:58
 
Большое спасибо за инструкцию! Все понятно! Во всем разобрался!
Наверх
 
 
IP записан
 
Вадим
Администратор
*****
Вне Форума


Всем привет!

Сообщений: 1078
Россия
Пол: male
Re: Предлагаю поделиться опытом
Ответ #3 - 26.09.2010 :: 09:09:28
 
Все-таки сканировать с разрешением 600 dpi тяжеловато. Долго. А вот сканы до 300 dpi сканер делает быстро. Лучше сканировать с разрешением 300 dpi, а потом искусственно повышать его до 600 dpi. Повышать разрешение отсканированных страниц можно в IrfanView http://www.irfanview.com Кстати и сканировать тоже удобно через эту программу. Программа бесплатная, вместе с ней следует скачать и установить пакет плагинов.

Для преобразования файлов в этой программе следует выбрать в верхнем меню "Файл" - "Преобразовать/переименовать группу файлов". Там надо найти "Папку", где лежат отсканенные файлы и нажать кнопку "Добавить все", задать путь к "Папке для результирующих файлов", выбрать результирующий формат и отметить галочкой "С дополнительными параметрами". После этого нужно нажать кнопку "Параметры" и в открывшемся окне отметить "ИЗМЕНИТЬ РАЗМЕР", "Новый размер как процент от исходного" (Ширина: 200%, Высота: 200%), "Сохранять пропорции", "Ресэплировать" (можно не отмечать) и "Установить значение DPI": 600. Можно поэкспериментировать и с другими параметрами. После этого следует нажать "ОК" для сохранения выбранных параметров. Все установки завершены, нажимаем кнопку "Старт" и долго ждем завершения преобразования.

Чем, собственно, это лучше? А тем, что в этом процессе вы не принимаете участия. Компьютер сам все делает, а вы в это время можете заниматься своими делами. Да и по времени все это происходит быстрее, чем сканирование в 600 dpi. Надо, правда, отметить, что качество скана в 600 dpi несколько выше, чем получаемого искусственно.
Наверх
 
WWW  
IP записан
 
ben_hog
Новичок
*
Вне Форума


Всем привет!

Сообщений: 31
Re: Предлагаю поделиться опытом
Ответ #4 - 26.09.2010 :: 21:11:23
 
Я придумал вот что: сканировать страницы с текстом и не растровыми картинками (с крупными линиями и элементами) в 300 дпи, а страницы с растровыми изображениями и рисунками с мелкими штрихами - в 600 дпи. Как думаете, так можно?
Наверх
 
 
IP записан
 
ben_hog
Новичок
*
Вне Форума


Всем привет!

Сообщений: 31
Re: Предлагаю поделиться опытом
Ответ #5 - 26.09.2010 :: 21:13:33
 
Я придумал вот что: сканировать страницы с текстом и не растровыми картинками (с крупными линиями и элементами) в 300 дпи, а страницы с растровыми изображениями и рисунками с мелкими штрихами - в 600 дпи. Как думаете, так можно?
Наверх
 
 
IP записан
 
Dmitry7
Модератор
*****
Вне Форума


Соберем Серии "НВЖНиТ"!

Сообщений: 5935
Санкт-Петербург
Пол: male
Re: Предлагаю поделиться опытом
Ответ #6 - 08.01.2011 :: 12:10:51
 
ben_hog писал(а) 26.09.2010 :: 21:13:33:
Я придумал вот что: сканировать страницы с текстом и не растровыми картинками (с крупными линиями и элементами) в 300 дпи, а страницы с растровыми изображениями и рисунками с мелкими штрихами - в 600 дпи. Как думаете, так можно?

для многих книг это все равно окажется равносильно сканированию в 600 dpi. очень долго...
Наверх
 

"Если хочешь сделать что-то хорошо, сделай это сам!"
332371574  
IP записан
 
папаВлад
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 100
Подмосковье
Пол: male
Re: Предлагаю поделиться опытом
Ответ #7 - 28.02.2012 :: 02:40:27
 
Вадим писал(а) 26.09.2010 :: 09:09:28:
"Ресэплировать" (можно не отмечать)

Уж, и не знаю как быть, и вот почему.
Стояла у меня эта галка, всегда стояла, а вчера я вдруг заметил на своих готовых djvu-файлах какое-то затемнение на всех страницах в виде толстого креста.
Пример: http://publ.lib.ru/ARCHIVES/R/''Roman-gazeta''/''Roman-gazeta'',1952.N04.[djv].z...Видно его не на всех мониторах, проверил на домашних - не просматривается ни под каким углом, заметил лишь на ноутбуке, когда крышка откинута до конца, т.е. взгляд падает на экран снизу. Стал изучать откуда этот крест вылазиет, грешил на сжатие, ан нет, оказалось сами tif-ы после увеличения с 300 до 600 dpi в IrfanView помечаются этим затемнением если стоит галка на "Ресэмплировать (выше качество)", а без этой галки картинки чистые выходят и причём размер самого tif гораздо меньше, для сравнения 4620х6050 = 26,7 МБ против 80 МБ, и время конвертации в разы меньше без ресэмплирования.
С другой стороны, ресэмпл убирает зубцы и даёт гладкие приятные края у буквы, а затемнённый крест можно потом убить путём пакетной обработки файлов с прибавлением контраста на +1 (пока не проверял), а может даже есть смысл сразу прибавить контраст при перегонке из 300 в 600.
Вобщем, тема для экспериментов...
Наверх
« Последняя редакция: 28.02.2012 :: 21:16:56 от Вадим »  
 
IP записан
 
nbl
Гуру
****
Вне Форума



Сообщений: 502
Кузбасс
Пол: male
Re: Предлагаю поделиться опытом
Ответ #8 - 28.02.2012 :: 11:32:14
 
Посмотрел я Вашу DjVu. А почему Вы не делаете бинаризацию? Зачем в этой книге серый фон? Делайте в битонале, только лучше станет.
Наверх
 
 
IP записан
 
GMAP
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 52
Somewhere there...
Пол: male
Re: Предлагаю поделиться опытом
Ответ #9 - 28.02.2012 :: 13:55:43
 
папаВлад писал(а) 28.02.2012 :: 02:40:27:
Вобщем, тема для экспериментов...

А Вы не могли бы выложить сырые сканы этого номера "Роман-газеты" куда-нибудь на обменник, можно частями? Обидно видеть растрату труда и времени с не самым лучшим результатом. Глядишь, и подсказал бы я что-то полезное, без зауми и долгого ожидания.
Наверх
 
 
IP записан
 
папаВлад
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 100
Подмосковье
Пол: male
Re: Предлагаю поделиться опытом
Ответ #10 - 28.02.2012 :: 22:18:32
 
nbl писал(а) 28.02.2012 :: 11:32:14:
А почему Вы не делаете бинаризацию? Зачем в этой книге серый фон? Делайте в битонале, только лучше станет.

Ну, не знаю что ответить, я когда пробовал, меня отпугнул тот момент, что у плохопропечатанных букв исчезают части, и буквы могут стать ещё хуже читаемыми. А при сером варианте ещё остаются некоторые видимые линии, и по ним можно догадаться, что за символ был в оригинале (до сжатия). Наверное, это главный аргумент, почему я отказался от двухцветного варианта.


GMAP писал(а) 28.02.2012 :: 13:55:43:
А Вы не могли бы выложить сырые сканы этого номера "Роман-газеты" куда-нибудь на обменник, можно частями? Обидно видеть растрату труда и времени с не самым лучшим результатом. Глядишь, и подсказал бы я что-то полезное, без зауми и долгого ожидания.

Сырые сканы не сохраняю, остаётся только вариант, который готов к сжатию. Переделывать всё не обязательно, достаточно будет описания процесса на примере одной страницы http://papavlad.ucoz.ru/pict/Img0083_2R.tif (1,3 МБ). Если это не сложно окажется, то возьму на вооружение. Времени я не много трачу на такой вариант, который вы видели выше, даже наоборот, постарался отказаться от всего, что может увеличить длительность процесса.
Наверх
 
 
IP записан
 
папаВлад
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 100
Подмосковье
Пол: male
Re: Предлагаю поделиться опытом
Ответ #11 - 28.02.2012 :: 22:41:17
 
А как же про затемнение в виде креста? Отпишитесь, хоть кто-нибудь увидел его?
Я сегодня немного помучал IrfanView, результаты избавления от затемнения прошли неудачно. При перегонке из 300 в 600 DPI c включённой функцией "Ресэмплировать (выше качество)" ставил ещё галку на "Контрастность", сначала единицу, потом двойку, тройку, 5, 10 - крест почти незаметен, а вот прямоугольник в центре не исчезает, добавил ещё "Яркость" на 5 - уже сама страница с цветной картинкой достаточно сильно изменилась, а прямоугольник не исчезает, и при ещё большем увеличении просматриваются мелкие пересекающиеся линии по всей странице. Я предположил, что программа накладывает сетку после того, как изображение увеличено, ан нет, поставил контраст на 100 - всё чисто, но оригинал уже совсем "сгорел".
Вернулся к началу эксперимента, убрал галки с добавления яркости и контраста, соответственно крест в полной красе. Вставляю страницу в Microsoft Office Picture Manager, добавляю контраст +1 и картинка чистая, и сколько не увеличивал, ничего лишнего не просматривается, и изображение не изменилось.
Получается, что после ресемпла придётся ещё одну операцию добавлять - пакетное увеличение контраста на единицу.
Наверх
 
 
IP записан
 
Kis
Активист
***
Вне Форума



Сообщений: 434
Россия, Москва
Пол: male
Re: Предлагаю поделиться опытом
Ответ #12 - 28.02.2012 :: 23:16:41
 
IMHO, это всё какой-то комсомольский способ обработки. Не лучше ли доверить обработку исходных серых сканов приличному специализированному софту? Тогда и никаких крестов не почудится не возникнет.
Пара-тройка минут на размышление над настройками СканКромсатора, три-четыре тестовых прогона, минутка на полуавтоматическую чистку мусора, и вот результат:
...
Можно сделать лучше, надо лишь взять серые сканы и побольше подумать над настройками.
Наверх
 
 
IP записан
 
папаВлад
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 100
Подмосковье
Пол: male
Re: Предлагаю поделиться опытом
Ответ #13 - 28.02.2012 :: 23:43:54
 
СканКромсатор пробовал несколько раз, ничего не понял, отказался в пользу СканТэйлора, у которого возможностей гораздо меньше. Чистку мусора в нём пытался делать, но обнаружив исчезновение полезных точек, так и не стал использовать эту функцию.

На той картинке, которую я выложил для испытаний, нет креста. Затемнение появляется после использования IrfanView, а вы увеличили картинку при помощи кромсатора, потому вам и не видно ничего.
Сейчас покажу, как выглядит файл после ресемплинга, с сеткой и пересечениями линий, я только чуток покрутил яркость, чтоб было видно на любом мониторе http://papavlad.ucoz.ru/pict/p001.tif (4,78 МБ)
Наверх
 
 
IP записан
 
Kis
Активист
***
Вне Форума



Сообщений: 434
Россия, Москва
Пол: male
Re: Предлагаю поделиться опытом
Ответ #14 - 29.02.2012 :: 00:25:39
 
На этой картинке крест вижу, но это истинный комсомольский крест (когда проблемы специально созданы исключительно для того, чтобы их решать). Видимо, в IrfanView заложен какой-то упрощенный метод ресэмплинга, который иногда дает неравномерный серый фон. Впрочем, без серого исходника это размышления ни о чем.  И вообще, я только могу повторить, что надо пользоваться специализированным софтом. SK -- это типичный пример того, что лучше сначала медленно добраться до аэропорта, а потом за несколько часов долететь, чем сутками в поезде ехать. Я раньше тоже в SK ничего не понимал. Теперь не понимаю гораздо больше Улыбка, но это уже совсем другой уровень непонимания. Про ST ничего сказать не могу, потому что не использовал. Прочитал только немногочисленные более-менее грамотные сравнения этих программ, и понял, что главный и практически единственный аргумент в его пользу -- это что он проще. А вот качество в общем случае не дает, настроек и умений для этого нет.
Наверх
« Последняя редакция: 29.02.2012 :: 00:34:11 от Kis »  
 
IP записан
 
nbl
Гуру
****
Вне Форума



Сообщений: 502
Кузбасс
Пол: male
Re: Предлагаю поделиться опытом
Ответ #15 - 29.02.2012 :: 04:46:13
 
папаВлад писал(а) 28.02.2012 :: 23:43:54:
СканКромсатор пробовал несколько раз, ничего не понял, отказался в пользу СканТэйлора, у которого возможностей гораздо меньше. Чистку мусора в нём пытался делать, но обнаружив исчезновение полезных точек, так и не стал использовать эту функцию.

И чем Вам ScanTaylor не угодил. Я за 1 мин обработал в нем Вашу картинку с параметрами по-умолчанию. Результат лучше, чем в сером DjVu.
...
Наверх
 
 
IP записан
 
GMAP
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 52
Somewhere there...
Пол: male
Re: Предлагаю поделиться опытом
Ответ #16 - 01.03.2012 :: 11:26:47
 
папаВлад писал(а) 28.02.2012 :: 22:18:32:
Сырые сканы не сохраняю, остаётся только вариант, который готов к сжатию

Сделать я сделал, быстро и вполне прилично, соблюдая баланс между затратами времени и всем прочим, обработка буквально в пару щелчков мышкой. Но доказывать что-либо у меня нет ни малейшего желания. Не пользуюсь ни ST, ни SK, поэтому никаких холиваров не приемлю.
Наверх
 
 
IP записан
 
Kis
Активист
***
Вне Форума



Сообщений: 434
Россия, Москва
Пол: male
Re: Предлагаю поделиться опытом
Ответ #17 - 01.03.2012 :: 12:32:22
 
А я сделал вообще без всяких щелчков мышкой, мгновенно и идеально, только вообще никому ничего не покажу и доказывать не буду, потому что вообще ничего не приемлю.
Язык
Наверх
 
 
IP записан
 
bolega
Гуру
****
Вне Форума



Сообщений: 781
Re: Предлагаю поделиться опытом
Ответ #18 - 01.03.2012 :: 17:54:48
 
GMAP несомненно большой дока в книгоделании, но кажется еще никто не видел его книг вживую. Все в стол, да в стол...  Улыбка
Наверх
 
 
IP записан
 
Dmitry7
Модератор
*****
Вне Форума


Соберем Серии "НВЖНиТ"!

Сообщений: 5935
Санкт-Петербург
Пол: male
Re: Предлагаю поделиться опытом
Ответ #19 - 01.03.2012 :: 19:30:02
 
GMAP писал(а) 01.03.2012 :: 11:26:47:
никаких холиваров не приемлю.

холивары - это что?
Наверх
 

"Если хочешь сделать что-то хорошо, сделай это сам!"
332371574  
IP записан
 
Jeffry
Постоялец
**
Вне Форума


Привет всем!

Сообщений: 83
Re: Предлагаю поделиться опытом
Ответ #20 - 01.03.2012 :: 19:44:44
 
Одно из двух - или holy war "священная война", либо holey ware - "дырявый софт".
Наверх
 
 
IP записан
 
Dmitry7
Модератор
*****
Вне Форума


Соберем Серии "НВЖНиТ"!

Сообщений: 5935
Санкт-Петербург
Пол: male
Re: Предлагаю поделиться опытом
Ответ #21 - 01.03.2012 :: 19:46:47
 
Jeffry писал(а) 01.03.2012 :: 19:44:44:
Одно из двух - или holy war "священная война", либо holey ware - "дырявый софт".

наверно, первое, с иронией)
Наверх
 

"Если хочешь сделать что-то хорошо, сделай это сам!"
332371574  
IP записан
 
dns
Гуру
****
Вне Форума


Всем привет!

Сообщений: 942
Красноярск
Пол: male
Re: Предлагаю поделиться опытом
Ответ #22 - 01.03.2012 :: 19:58:53
 
Про холивары:

http://lurkmore.to/Холивар
Наверх
 
 
IP записан
 
папаВлад
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 100
Подмосковье
Пол: male
Re: Предлагаю поделиться опытом
Ответ #23 - 01.03.2012 :: 21:13:40
 
nbl писал(а) 29.02.2012 :: 04:46:13:
И чем Вам ScanTaylor не угодил. Я за 1 мин обработал в нем Вашу картинку с параметрами по-умолчанию. Результат лучше, чем в сером DjVu.

Да нет, наоборот, ScanTaylor помогает мне подкрутить и обрезать картинки, больше я ничего от него не прошу. На вывод вывожу в Цветном/сером, и даже не из-за того, что чёрно-белое изображение, лично мне, не нравится, а потому что потом делаю два разных варианта, один с профилем "фото", второй как-то так, как сейчас видите в готовом djvu, и потом эти же файлы остаются в папке на хранение.
Наверное, я сейчас взорву форумчан, но мне действительно не по вкусу этот метод, который вы называете битонал.
Переубеждать меня не обязательно, всё-равно серые страницы глазу приятнее и ближе к оригиналу, а из ваших предложений я сам сделаю правильные выводы и следующие номера сделаю по вашим пожеланиям, вот только про уничтожение мусора ничего обещать не могу, надо поэксперементировать.
Если я правильно понимаю, то необязательно именно в ScanTaylor переводить в ч/б, а можно при сжатии выбрать этот профиль.

GMAP, жаль, что вы не поделились опытом, собственно и топик подходящий.
Наверх
 
 
IP записан
 
Dmitry7
Модератор
*****
Вне Форума


Соберем Серии "НВЖНиТ"!

Сообщений: 5935
Санкт-Петербург
Пол: male
Re: Предлагаю поделиться опытом
Ответ #24 - 01.03.2012 :: 21:30:32
 
GMAP писал(а) 01.03.2012 :: 11:26:47:
Сделать я сделал, быстро и вполне прилично, соблюдая баланс между затратами времени и всем прочим,

можно посмотреть результат? хотя бы пару страниц, как получилось
Наверх
 

"Если хочешь сделать что-то хорошо, сделай это сам!"
332371574  
IP записан
 
Dmitry7
Модератор
*****
Вне Форума


Соберем Серии "НВЖНиТ"!

Сообщений: 5935
Санкт-Петербург
Пол: male
Re: Предлагаю поделиться опытом
Ответ #25 - 30.03.2012 :: 18:55:00
 
Kis писал(а) 15.09.2010 :: 01:34:43:
...5. Выставляем параметры обработки текста (Binarization, Grey Enhance и т.д.). Я выбрал такие: Binarization = MiddleDark, Enhance image = true, Smooth = 1, Blur = 0, Sharpen = 1, Grey Enhance = true, Correct Illumination = true, Adjust histogram = false, Method = Safe, Enhance Contour = Enable & Auto, остальное -- либо по умолчанию, либо не надо.


уточните пожалуйста для установки
"Correct Illumination = true"
там стоит цифра - от 1 до 10. если оставить по умолчанию "10", то часто часть полезного текста пропадает. Как правильно выбирать здесь установку?
Наверх
 

"Если хочешь сделать что-то хорошо, сделай это сам!"
332371574  
IP записан
 
Kis
Активист
***
Вне Форума



Сообщений: 434
Россия, Москва
Пол: male
Re: Предлагаю поделиться опытом
Ответ #26 - 30.03.2012 :: 23:32:35
 
В большинстве случаев я предпочитаю "Method = Safe", который, видимо, сам разбирается со значением Strength (или это значение не имеет смысла в этом методе -- тут я некомпетентен). И только если результат Safe мне не нравится, я начинаю подбирать другие методы (как правило, Soft). Что я в точности выставлял полтора года назад, уже и не помню, но раз я написал только про Method, но не написал про Strength, то наверняка это был Method, не позволявший изменять Strength.
...
Наверх
 
 
IP записан
 
папаВлад
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 100
Подмосковье
Пол: male
Re: Предлагаю поделиться опытом
Ответ #27 - 01.04.2012 :: 01:03:59
 
Хочу посоветоваться.
Я про Роман-газету голову ломаю, есть несколько вариантов дальнейших действий.

1. Здесь то, на что я способен. Сделать ещё лучше смогу, но это будет нерациональное использование времени, т.к. не знаю всех премудростей оцифровки голого текста, и потому прошу выбрать один из двух файлов для распространения в сети:
в серых тонах (мне больше нравится)
http://narod.ru/disk/44746161001.62fd32a305b08ee53ff941f4f726a9d1/Roman-gazeta.1... 12.7 МБ
или чёрно-белый вариант (ближе по душе местным форумчанам)
http://narod.ru/disk/44747551001.6fba6188a421691c2fc82681833bab23/Roman-gazeta.1... 11.6 МБ

также следующий номер
http://narod.ru/disk/44747646001.fdc2f80ed1e3b3c748eede5e0605a2e2/Roman-gazeta.1... 10.3 МБ
http://narod.ru/disk/44748717001.ec43d02bab8cb2ac9e67cc594ae5b442/Roman-gazeta.1... 10 МБ

-
Возможно, оба варианта никому не понравятся, тогда...
2. Сырые сканы этих двух номеров (цветные, tif/несжатый, 300dpi):
http://narod.ru/disk/44760982001.80b39aa3503fbc58f06c1c1256e231f8/x-rg.1952-05-s... 1.49 ГБ
http://narod.ru/disk/44830469001.f5900984d236149b2853a63f11fc509b/x-rg.1952-06-s... 1.62 ГБ

или после ScanTailor, выровненные с белыми полями (цветные, tif/несжатый, 300dpi):
http://narod.ru/disk/44753522001.e541064dfd3eabfbba94b865206aff59/x-rg.1952-05-o... 1.27 ГБ
http://narod.ru/disk/44801029001.fd1ce37b3586250c267576663117d265/x-rg.1952-06-o... 1.40 ГБ

Прошу учесть, что журналов много. Так что, если кому совсем скучно, то расчитывайте на длительное сотрудничество.

-
Возможно, никто не станет связываться с этими сканами по какой-либо причине (сканы плохие, времени нет, журнал неинтересный...), в этом случае...
3. Я больше не сканирую этот журнал (кто-нибудь/когда-нибудь всё равно сделает, имея экземпляры в лучшей сохранности), или всё-таки я делаю на своё усмотрение, но не публикую в этой библиотеке.

-
Не подумайте, что смогу обидеться на какие-то ваши ответы. Без проблем заброшу в сарай всю стопку, т.к. ожидают сканирования ещё много журналов, вот ими и займусь.
Наверх
 
 
IP записан
 
Dmitry7
Модератор
*****
Вне Форума


Соберем Серии "НВЖНиТ"!

Сообщений: 5935
Санкт-Петербург
Пол: male
Re: Предлагаю поделиться опытом
Ответ #28 - 01.04.2012 :: 09:03:23
 

папаВлад писал(а) 01.04.2012 :: 01:03:59:
...
3. Я больше не сканирую этот журнал (кто-нибудь/когда-нибудь всё равно сделает, имея экземпляры в лучшей сохранности), или всё-таки я делаю на своё усмотрение, но не публикую в этой библиотеке...


большая просьба не забрасывать сканирование всё-таки. У Вас хорошо получается.

тот вариант, что в черно-белом варианте - гораздо лучше! по мне, так заметно лучше и не сделать.
если Вам не сложно, продолжайте и дальше в bw делать ?

(а по поводу любимого Вами серого: я попробовал увеличить текст - очень много частей букв расплывается в светло-сером оттенке, которого в реальной книге нет, или вообще почти незаметно. Если честно - плохо смотрится. Еще минус - медленнее листается в просмотрщике, дольше перерисовывается)


резюмируя (имхо):
  черно-белый вариант лучше, и он годится для опубликования в библиотеке. Но последнее слово - за Вадимом.

Наверх
 

"Если хочешь сделать что-то хорошо, сделай это сам!"
332371574  
IP записан
 
папаВлад
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 100
Подмосковье
Пол: male
Re: Предлагаю поделиться опытом
Ответ #29 - 01.04.2012 :: 11:00:44
 
Ну, если ч/б пригоден, то запускаю его в сеть и следующие номера такие же будут.
Если вдруг позже ещё кто что предложит, то пишите, возможны варианты.
Наверх
 
 
IP записан
 
Страниц: 1 2 
Послать Тему Печать