Первая делёжка.
Недавно
ben_hog попросил меня написать о том, как я кодирую в djvu растровые фотографии. Примеры результатов можно найти, например,
здесь или
здесь.
К дальнейшему тексту прилагаются иллюстрации на 30 мегабайт, которые можно скачать на
rapidshare.com или
ifolder.ru. Имена файлов, о которых ведется речь, даны в квадратных скобках (расширение tif я опустил).
Инструкция (проект)1. Сканируем. Я это делаю на 600 dpi. [i4-0]
2. Загружаем сканы в ScanKromsator.
3. Нажимаем "Черновую расстановку резаков", при необходимости поправляем вручную результаты.
4. Вручную обводим все картинки и придаем им статус "picture zone".
5. Выставляем параметры обработки текста (Binarization, Grey Enhance и т.д.). Я выбрал такие: Binarization = MiddleDark, Enhance image = true, Smooth = 1, Blur = 0, Sharpen = 1, Grey Enhance = true, Correct Illumination = true, Adjust histogram = false, Method = Safe, Enhance Contour = Enable & Auto, остальное -- либо по умолчанию, либо не надо.
6. Нажимаем "Process" и ждем.
7. При необходимости поправляем вручную угол поворота и обрабатываем (Process left page, Process right page) еще раз такие страницы. Получаются отдельно файлы с текстом и с картинками [i4-1-text, i4-1-pict1, i4-1-pict2].
(Теперь начинается самое интересное...)
8. Картинки загружаем в растровый графический редактор (любой из более-менее серьезных: GIMP, Adobe Photoshop, Corel PhotoPaint, ... в общем, тот, к которому вы привыкли). Я привык к GIMP.
9. Filters -> Enhance -> Sharpen. Выбираем для Sharpness какое-нибудь достаточно большое значение (мне нравится 70) [m1], нажимаем OK. Сейчас я сохраню картинку для инструкции [i4-1-pict1-1, i4-1-pict2-1], но обычно я этого не делаю, а сразу перехожу к следующему пункту. (На полученной картинке виден муар, но как с ним бороться, я пока не знаю, иногда удается свести его к минимуму, подложив при сканировании под страницу черную-пречерную бумагу.)
10. Colors -> Curves. Выбираем кривую в виде ступеньки [m2]. Можно подвигать ступеньку за верхнюю и нижнюю точки влево-вправо, чтобы добиться наилучшей сочности картинки. Теперь картинка стала почти бинаризованной, так что остается закрепить это положение "юридически": Image -> Mode -> Indexed, Use black and white (1-bit) palette. Сохраняем картинку (можно сразу со сжатием "CCITT Group 4 fax" [i4-1-pict1-2, i4-1-pict2-2], желательно под другим именем, чтобы иметь возможность отката.
11. Теперь надо в графическом редакторе пройтись белой кисточкой по краю картинки (как в "текстовом" файле, так и в "картиночных"): там после бинаризации могут остаться артефактные точки. [i4-2-text, i4-2-pict1, i4-2-pict2]. Во многих случаях результат можно проверить при помощи IrfanView: надо загрузить в него получившиеся файлы и сделать Auto Crop Borders (Ctrl+Shift+Y), после чего изображения должны обрезаться строго до размеров текста/картинки (если не уменьшились, то надо искать оставшиеся артефактные точки).
12. Подсовываем сделанные файлы обратно в ту папку, в которой с ними работает ScanKromsator (с изначальными именами, конечно).
13. Возвращаемся в ScanKromsator, делаем картинкам Merge и сохраняем результат. [i4-result]
14. Кодируем этот результат в djvu с профилем bitonal. [i4-result.djvu]
Это и есть тот максимум, который я могу выжимать из растровых фотографий. Наверняка что-то можно улучшить (а может, надо все делать совсем не так). Особенно мне не нравится муар. Наверное, он возникает по самым разным причинам (изначальное присутствие в бумажном исходнике, железо и/или софт сканера, фильтры графического редактора, кодер djvu, программа-просмотрщик, отображение на "крупноточечном" экране компьютера). По-моему, последняя причина вносит самый "тяжелый" вклад в появление муара. А может, и еще что-то влияет.
Но результат мне в целом нравится. Так над изначально "запорченной" растром в издательстве аналоговой фотографией не производится еще одна "порча" -- размытие.
Еще я подозреваю, что все эти операции можно проделать в СканКромсаторе, но в нем визуальный контроль этапов обработки (для меня) неочевиден.
Критика, замечания и улучшения, а также совсем другие инструкции, приводящие к хорошим результатам, приветствуются.
P.S. Книга будет попозже, когда я сделаю, проверю и перепроверю остальные картинки. На самом деле она (И.П. Вейнберг, "Человек в культуре древнего Ближнего Востока") в интернете уже есть, вот только картинки и обложка там в лучшем случае на четверочку с минусом, а текст очень неплохо сделан, и я его переделывать не планирую.