OCR форумы Добро пожаловать, Гость. Пожалуйста, выберите Вход или Регистрация
Всем привет!
Hi all!
 
  ГлавнаяСправкаПоискВходРегистрация Администратор Библиотека  
 
Страниц: 1 2 3 ... 10
Послать Тему Печать
Создание DJVU-книг (Прочитано 218725 раз)
Kolyambus
Новичок
*
Вне Форума


Всем привет

Сообщений: 4
Пол: male
Создание DJVU-книг
15.03.2005 :: 15:51:08
 
Я бы летчиком стал, пусть меня научат. Улыбка

        Как создовать *.DJVU ???
Наверх
« Последняя редакция: 14.01.2012 :: 21:53:01 от Dmitry7 »  
 
IP записан
 
Slawa-614
Активист
***
Вне Форума


Всем привет!

Сообщений: 380
Пол: male
Re: DJVU
Ответ #1 - 15.03.2005 :: 17:34:09
 
Kolyambus писал(а) 15.03.2005 :: 15:51:08:
Как создовать *.DJVU ???


 Это графический формат DJVU, для просмотра требуется вьюер, понимающий
этот формат. Непосредственно данный файл (3 версии djvu) наиболее удобен
вьюер DjVuSolo.
 Проходил по фэхе 957SHEMA - книжки по радиоэлектронике:
 (http://node.ionb.ru/cgi-bin/fecho.pl?fecho=957SHEMA)
DVS3-NCI.RAR                2.003.343 Lizard Tech "вьюер DjVuSolo
v.3.0-NonCom

 Кроме того, этот формат просматривают и другие вьюеры: IrfanView,
DjVuControl, DjVuBrowser и другие (есть самостоятельные программы, и
есть плагины, встраиваемые в Internet Brouser (Internet Explorer), после
чего тот начинает "понимать" (и показывать) содержимое этого формата
графики.
 Инсталяшки и плагины, лежат на разных сайтах интернета, но лучше
скачать их с сайтов разработчиков: http://www.irfanview.com,
http://www.lizardtech.com/ (причем - уже для 4.5 версии djvu).

DjVuControl_en_US.RAR           701.576
all_plugins.zip               5.680.607
IrfanView-all_plugins.exe     4.886.016
iview391.exe                    822.272
8bf_tools.zip                   109.359
canon_crw.zip                 1.948.440
DjVuBrowserPlugin45.exe       8.123.223
iv_formats.zip                3.992.683
djvueditorpro.zip             2.564.636


 Для создания DJVU-формата (имеется ввиду, что набор картинок в BMP или TIF уже имеется: насканен) - запускаем DjvuSolo, далее в меню:

 File -> Open -> тип файлов JPG/BMP/TIF -> открываем первый файл пакета, затем Edit -> Append Pages -> тип файлов -> устанавливаем курсор на самый последний и, удерживая <Shift>, отмечаем все файлы от последнего ко второму (это важно) <Enter>

 После загрузки всех файлов (можно просмотреть, добавить или удалить какие-то странички)
 File -> Encode as Djvu -> вводим новое название пакета -> <Enter>
 Вот и все.

 Вот с обратной конвертацией у DjvuSolo есть проблемы - эта программа умеет
выгружать только по одной странице. А конвертацию всего пакета djvu в bmp на "автопилоте" умеют делать другие программы следующих версий, например IrfanView v 4.0
Наверх
« Последняя редакция: 15.03.2005 :: 17:58:22 от Zmiy »  

Slawa-614
 
IP записан
 
Zmiy
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 106
Минск
Пол: male
Re: DJVU
Ответ #2 - 16.03.2005 :: 01:18:32
 
Slawa-614 писал(а) 15.03.2005 :: 17:34:09:
 Для создания DJVU-формата (имеется ввиду, что набор картинок в BMP или TIF уже имеется: насканен) - запускаем DjvuSolo, далее в меню:

 File -> Open -> тип файлов JPG/BMP/TIF -> открываем первый файл пакета, затем Edit -> Append Pages -> тип файлов -> устанавливаем курсор на самый последний и, удерживая <Shift>, отмечаем все файлы от последнего ко второму (это важно) <Enter>

 После загрузки всех файлов (можно просмотреть, добавить или удалить какие-то странички)
 File -> Encode as Djvu -> вводим новое название пакета -> <Enter>
 Вот и все.


Нет, неправильно!
Во-вторых, ты не написал в каком разрешении сканировать - это главное!

Если делать как ты написал, то в полученных djvu могут быть искажения букв на мелких шрифтах - как минимум "и" на "н" и наоборот... (ошибка "инь" (С) Astra с ru-board)
Сравнивать с OCR-текстами в других форматах не надо, т.к. там ошибки распознавания и вычитки легко правятся. Чего не скажешь о djvu.
Умники с RU.OCR вообще заявляют -
Цитата:
GS> В отношении с информацией лучше хоть как-то, чем никак. Потому что в первом
GS> случае информация доступна (причём, информация достоверная, аутеинтичная!),
GS> а во-втором нет.

RE> этого никак не могут понять противники djvu.
RE> подавай им распознанный текст, да еще и отверстай заново, и баста.

Какая же тут черт возьми "достоверность" и "аутентичность" !?

Далеко ходить не будем - http://vgershov.lib.ru/ARCHIVES/A/ANDRONIKOV_Irakliy_Luarsabovich/Pervyy_raz_na_...
- внимательно посмотрите хотя бы начало страницы 4... Ужас... Неужели OCRщику было трудно посмотреть на результаты своего труда?!...
Сходим подальше - зайдите на сайт журнала Радио и посмотрите номер 1 за 1946 год - там тоже куча ошибок! Это они отдолжение сделали?!

Интернет уже наводнен "такими" djvu "благодаря" устаревшим инструкциям со всяких cqham и др., авторы статей с которых по ослиному упрямо не видят проблем и продолжают умалчивать наличие таких ошибок.

1. Ошибок не будет, если сканировать в разрешении как минимум 600 dpi. Увы, но это занимает намного больше времени, чем 300 dpi. И сомневаюсь, что кто-то на любительском уровне будет так сканировать...

2. Ошибок не будет, если сканировать в 300 dpi, но в профилях Solo (profiles\documenttodjvu.conf) прописать в секциях -
bitonal300: bitonal
dpi=-300
lossless=true
и
scan300: H-300dpi H-normal-quality H-normal-text
description="Scanned 300 DPI Documents"
lossless=true
- если эти варианты будут выбираться при кодировании в Solo.
Но при lossless=true вырастет размер файла. Зато не будет ошибок! Что лучше - маленький djvu с кучей ошибок или большой без ошибок?!

Тут можно скачать тесты преобразования tiff 300 dpi в djvu, на которых видны ошибки "инь" -
http://zpdd.chat.ru/files/djvutest.rar 1200к (читать readme.txt)

Тут другие тестовые tiffы в 300/400/600 dpi и +0/+10/+20/+30 яркости -
http://zpdd.chat.ru/files/test2.rar 1979к
Увы, но без lossless в 300 dpi не удается сконвертировать в djvu без ошибок "инь"... Похоже, что софт Lizarda не заточен под кирилицу...
Наверх
 

http://zpdd.chat.ru - Сканирование литературы
WWW  
IP записан
 
Slawa-614
Активист
***
Вне Форума


Всем привет!

Сообщений: 380
Пол: male
Re: DJVU
Ответ #3 - 16.03.2005 :: 01:26:57
 
Zmiy писал(а) 16.03.2005 :: 01:18:32:
Нет, неправильно!
Во-вторых, ты не написал в каком разрешении сканировать - это главное!
2. Ошибок не будет, если сканировать в 300 dpi, но в профилях Solo (profiles\documenttodjvu.conf) прописать в секциях -
bitonal300: bitonal
dpi=-300
lossless=true
и
scan300: H-300dpi H-normal-quality H-normal-text
description="Scanned 300 DPI Documents"
lossless=true


 У меня эти настройки стоят давно, поэтому я на них не заострялся. Но, в принципе - ответный файлик, периодически рассылаемый мной на вопросы публики (который я скопировал сюда) можно будет поправить.

Zmiy писал(а) 16.03.2005 :: 01:18:32:
Далеко ходить не будем - http://vgershov.lib.ru/ARCHIVES/A/ANDRONIKOV_Irakliy_Luarsabovich/Pervyy_raz_na_...
- внимательно посмотрите хотя бы начало страницы 4... Ужас... Неужели OCRщику было трудно посмотреть на результаты своего труда?!...


Кстати, я оба этих DJVU с Андронниковым уже распознал и отправил Вадиму письмом.

Наверх
 

Slawa-614
 
IP записан
 
Zmiy
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 106
Минск
Пол: male
Re: DJVU
Ответ #4 - 16.03.2005 :: 10:31:04
 
Цитата:
У меня эти настройки стоят давно, поэтому я на них не заострялся

Тоже умалчиваешь? Печаль
По умолчанию же их нет в профилях...
Наверх
 

http://zpdd.chat.ru - Сканирование литературы
WWW  
IP записан
 
Kolyambus
Новичок
*
Вне Форума


Всем привет

Сообщений: 4
Пол: male
Re: DJVU
Ответ #5 - 17.03.2005 :: 15:53:52
 
Slawa-614 писал(а) 15.03.2005 :: 17:34:09:
DjVuControl_en_US.RAR           701.576
all_plugins.zip               5.680.607
IrfanView-all_plugins.exe     4.886.016
iview391.exe                    822.272
8bf_tools.zip                   109.359
canon_crw.zip                 1.948.440
DjVuBrowserPlugin45.exe       8.123.223
iv_formats.zip                3.992.683
djvueditorpro.zip             2.564.636


Все ли из перечисленных прог нужны для создания DJVU.Озадачен
Наверх
« Последняя редакция: 17.03.2005 :: 16:00:30 от Kolyambus »  
 
IP записан
 
Slawa-614
Активист
***
Вне Форума


Всем привет!

Сообщений: 380
Пол: male
Re: DJVU
Ответ #6 - 17.03.2005 :: 16:59:19
 
Kolyambus писал(а) 17.03.2005 :: 15:53:52:
Все ли из перечисленных прог нужны для создания DJVU.Озадачен


  Разумеется, нет. Нужна одна, максимум - 2 программы. Лично я пользуюсь DjvuSolo v.3 за удобство просмотра и конвертации сканов в DJVU, а IrfanView v 4.5 - только для просмотра чужих DJVU-шек версии 4 и выше (которых Solo не берет). Ну и ей же при необходимости конверчу из DJVU в BMP (DjvuSolo умеет конвертить только по 1 страничке, а Irfan - скопом, но для просмотра он неудобен).

А если нужен только просмотр - лучше брать плагин к Эксплореру. Отдельной программы нет, но зато Эксплорер начинает сам понимать этот граф.формат.
Наверх
 

Slawa-614
 
IP записан
 
Zmiy
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 106
Минск
Пол: male
Re: DJVU
Ответ #7 - 18.03.2005 :: 00:46:14
 
Есть отдельная программка для просмотра djvu - DjvuReader -
http://opendjvu.webhost.ru/
Если бы у автора было больше свободного времени, то она была бы еще лучше... А так - возможностей у плугина к Эксплореру все-таки больше.

Вот ссылка на хорошую страничку по теме DJVU -
http://www.dstu2204.narod.ru/doc/djvu/djvu.htm
- там есть и программы, и их описание, и разные ссылки...
Наверх
« Последняя редакция: 18.03.2005 :: 00:57:55 от Zmiy »  

http://zpdd.chat.ru - Сканирование литературы
WWW  
IP записан
 
Вадим
Администратор
*****
Вне Форума


Всем привет!

Сообщений: 1062
Россия
Пол: male
Re: DJVU
Ответ #8 - 04.04.2005 :: 20:26:48
 
Проверил некотрые из своих DJVU файлов. Да, иногда ошибки встречаются. Почему-то DjvuSolo упорно переделывает некоторые буквы в некоторых текстах. Например буквы "и" и "я" в букву "н" и наоборот. Причем это происходит только с мелкими шрифтами. Обычный шрифт книги как правило не страдает, а подстраничные сноски могут быть искажены. Причем шрифт "Таймс" малоподвержен этому, а шрифты энциклопедических изданий искажаются сильно.

Прописал в настройках DjvuSolo рекомендованные выше "true". Мама родная! Файл увеличился аж в 3-4 раза, а ошибки все остались!!! Ну и кому это нужно?..

Сейчас сканирую с разрешением 300dpi. Попробую как-нибудь увеличить разрешение до 400-600dpi - может это поможет.
Наверх
 
WWW  
IP записан
 
Zmiy
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 106
Минск
Пол: male
Re: DJVU
Ответ #9 - 04.04.2005 :: 22:56:32
 
Цитата:
Мама родная! Файл увеличился аж в 3-4 раза, а ошибки все остались


Ошибки остались даже с lossless ? Хм... странно...
Если не трудно исходный файл куда-нибудь выложи, посмотрим....
Наверх
 

http://zpdd.chat.ru - Сканирование литературы
WWW  
IP записан
 
Andrey74
Новичок
*
Вне Форума


Всем привет!

Сообщений: 3
Пол: male
Re: DJVU
Ответ #10 - 10.02.2006 :: 21:04:26
 
Вадим писал(а) 04.04.2005 :: 20:26:48:
Прописал в настройках DjvuSolo рекомендованные выше "true". Мама родная! Файл увеличился аж в 3-4 раза, а ошибки все остались!!! Ну и кому это нужно?..


Вадим, а можно посмотреть ваши настройки для SOLO?
Наверх
 
 
IP записан
 
Вадим
Администратор
*****
Вне Форума


Всем привет!

Сообщений: 1062
Россия
Пол: male
Re: DJVU
Ответ #11 - 11.02.2006 :: 14:36:28
 
Andrey74 писал(а) 10.02.2006 :: 21:04:26:
Вадим, а можно посмотреть ваши настройки для SOLO?

Да они здесь же выше даны. Рекомендации Zmiy
Code:
1. Ошибок не будет, если сканировать в разрешении как минимум 600 dpi. Увы, но это занимает намного больше времени, чем 300 dpi. И сомневаюсь, что кто-то на любительском уровне будет так сканировать...
2. Ошибок не будет, если сканировать в 300 dpi, но в профилях Solo (profiles\documenttodjvu.conf) прописать в секциях -
bitonal300: bitonal
dpi=-300
lossless=true
и
scan300: H-300dpi H-normal-quality H-normal-text
description="Scanned 300 DPI Documents"
lossless=true
- если эти варианты будут выбираться при кодировании в Solo.
Но при lossless=true вырастет размер файла. Зато не будет ошибок! Что лучше - маленький djvu с кучей ошибок или большой без ошибок?!
 



Некоторые замечания:
Если в текстах буквы большие (например, детские книги), то можно использовать настройки Solo по умолчанию. Ошибок (при разрешении 300 dpi) не будет и файл не увеличится.
Если в тексте шрифт мелкий (журналы, например), то в Solo нужно ввести вышеуказанные настройки. Но при этом размер файла DJVU может увеличится в 2-4 раза.
Если в тексте помимо мелкого шрифта присутствует большое количество иллюстраций (цветных и полутоновых), то желательно (если хватит духу) сканировать с разрешением 600 dpi. Тогда на картинках искажения (раковины), будут менее заметны. Solo можно использовать при этом с настройками по умолчанию или с измененными настройками - разницы нет.

Для удобства можно поставить на свой компьютер Solo 2 раза (это допускается, если ставить в разные папки). В одном случае оставить как есть, а в другом ввести изменения в настройки. И, в зависмости от текста печатного издания, использовать либо один, либо другой вариант...

Еще одно замечание. При сканировании в цвете или полутоне. Чем бледнее (разбеленнее) отсканированный текст, тем меньше делает ошибок Solo при DJVU-ировании. Чем текст ярче и контрастнее, тем больше ошибок и выше размер DJVU файла. Тут тоже нужно искать оптимум...
Наверх
 
WWW  
IP записан
 
Вадим
Администратор
*****
Вне Форума


Всем привет!

Сообщений: 1062
Россия
Пол: male
Re: DJVU
Ответ #12 - 24.09.2006 :: 21:16:49
 
Что-то тема заглохла. Можно подумать, что и сказать уже нечего. Попробую поделиться некоторым опытом. Писать буду максимально подробно, чтобы и новички поняли.

Цветные журналы в DJVU:

Программы:
PhotoShop - лучше взять и установить с купленного диска;
IrfanView - бесплатная программа; получить ее и все плагины к ней можно с сайта http://www.irfanview.com
DjVuSolo-3.1 - программу и русификатор к ней лучше взять с сайта http://www.djvu-soft.narod.ru
1. Сканирование. Скан ведется через драйвер сканера в цвете 24 бит с разрешением 300 dpi. Чтобы получить более насыщенные цвета, можно применить встроенные в драйвер фильтры коррекции цвета (для каждого сканера индивидуально). Чтобы снизить желтизну бумаги в старых журналах и убрать просвет обратной стороны страницы значение яркости и контрастности в драйвере завышается до 10 (лучше подобрать под конкретный журнал) и под страницу перед сканированием подкладывается лист черной бумаги (лучше всего использовать черный картон из набора цветного картона для детских поделок, который продается в книжных магазинах). Приложение особого значения не имеет. Лично я сканирую журналы через Фотошоп 5.5. Там же обрезаю страницы (примерно, на глаз). Каждая страница сохраняется на диск в формате цветного BMP (!!!). Все страницы каждого журнала размещаются в отдельной папке.
2. Обработка. Для этого спользуется IrfanView-3.98 (СканКромсатор я для журналов не применяю).
Открыть в меню: "Файл" \ "Преобразовать группу файлов".
Найти в окне "Папка" папку со сканом журнала, открыть ее и нажать "Добавить все".
Используя кнопку "Обзор" рядом с окном "Результирующая папка", найти папку, куда будут сохраняться результаты обработки.
"Операция" - Пакетное преобразование.
"Результирующий формат" - BMP-Windows Bitmap.
Отметить галочкой "Использовать дополнительные параметры".
Нажать "Настроить параметры" (параметры устанавливаются один раз и потом запоминаются программой). В открывшемся окне установить: "Сохранять пропорции" (отметить); "Ресэмплировать" (отметить, но можно и не использовать т.к. сильно замедляет процесс); "установить значение DPI" - 600; "ИЗМЕНИТЬ РАЗМЕР" (отметить); "Новый размер как процент от исходного" - 200. Остальное все оставить как было по умолчанию. Нажать ОК.
Все, теперь можно нажать "СТАРТ" и ждать результатов обработки.
3. DJVUирование. Используется DjVuSolo-3.1 (создает Djvu-файлы версии 21). Советую использовать именно эту прорамму, т.к. другие ничего, кроме увеличения объема выходного файла, не дают. Более того, уже не раз отмечались проблемы с чтением плагинами файлов версии 25.
Работа в DjVuSolo-3.1 (русифицированная версия; без изменения настроек).
В верхнем меню нажать "Файл" \ "Открыть". В открывшемся окне найти папку с вашими файлами BMP (не забудьте в окошке "Тип файлов" выбрать BMP, а то не увидете их). Нажимаете на первом файле. Файл появляется в 2-х окнах программы: слева - макет страницы, справа - вид самой страницы. Щелкаете правой кнопкой мыши на макете первой страницы (слева), выбираете в меню: "Вставить страницы после". В открывшемся окне (как и выше) видны все ваши файлы BMP. Перемещаетесь в конец списка и, удерживая левую клавишу мыши, выделяете все файлы. Затем, удерживая клавишу Ctrl, щелкаете на первом файле, исключая его из выделения. Нажимаете "Открыть". Теперь все ваши страницы должны появится в левой части программы в нужном порядке. Проверьте, на всякий случай, в нужном ли порядке они следуют. Порядок их можно менять перетаскиванием мышкой.
Теперь можно DJVU-ировать. Нажимаете в верхнем меню "Файл" \ "Сохранить" и далее по порядку: "Выбор формата" - Связанный; задаете "Имя файла"; "Разрешение" не трогайте, метод сжатия "Сканированное". Нажимаете ОК.
После некоторого времени файл будет DJVUирован. Нажмите в верхнем меню программы "Правка" \ "Масштаб запуска документа" и установите FitPage. И еще раз "Правка" \ "Цвет фона документа" и выбирите цвет стола, на котором будут просматриваться листы. Нажмите в верхнем меню "Файл" \ "Сохранить".
Все, файл готов и его можно просмотреть в броузере.
Наверх
« Последняя редакция: 13.04.2007 :: 22:35:40 от Вадим »  
WWW  
IP записан
 
Minor
Активист
***
Вне Форума


Бывший участник

Сообщений: 278
Петербург
Пол: male
Вопрос к nnevt
Ответ #13 - 17.10.2006 :: 09:19:49
 
Спасибо. Сканы - приятно посмотреть.
В связи - пара вопросов:
  • Чем Вы ориентируете текст на странице? На страницах с неполным текствовым блоком, последний у Вас выровнен по нижнему краю (см. стр.6 в nnevt писал(а) 14.10.2006 :: 05:05:44:
    Степаненко Б.Н. Органическая химия.
    , например).

  • Не могли бы Вы озвучить причины, по которым Вы такое выравнивание предпринимаете - оно, ведь, все же, искажает макет книги...

Наверх
 
 
IP записан
 
Вадим
Администратор
*****
Вне Форума


Всем привет!

Сообщений: 1062
Россия
Пол: male
Re: DJVU
Ответ #14 - 02.12.2006 :: 19:31:49
 
ОБМЕН ОПЫТОМ

Za.Lexx "Как это делаю я" (подробнее см. в прикрепленном файле).

I. СКАНИРОВАНИЕ
  1. Просто берем сканер (у меня это Epson Perfection 1270), запускаем его стандартную утилиту сканирования, выставляем 300 дпи, 24-bit Color, больше ничего не трогаем. У большинства родных утилит сканирования есть функция автосохранения отсканированных изображений с автоматической генерацией имени файла. Тип файла используем, например, TIFF. (Ни в коем случае не JPG).
  2. Закладываем журнал в сканер на нужной странице, нажимаем кнопку сканирования.
  3. Повторяем пункт 2 пока не отсканируем все интересующие страницы.
  4. Для 68 страничного журнала получается около 1.5Гб
ПРИМЕЧАНИЕ: Можно воспользоваться какими-либо сторонними специализированными программами, просмотрщиками и т.п., предоставляющими аналогичный функционал. Советуют использовать VueScan, но у меня она никак не захотела работать с моим сканером. Можно сканировать в разрешении 600 дпи, но это будет значительно медленнее.

II. ПЕРВИЧНАЯ ОБРАБОТКА, "ОТБЕЛИВАНИЕ"
  1. Открываем страницу в графическом редакторе (я использовал Adobe Photoshop CS2)
  2. Инструментом 'Crop Tool' обрезаем лишнее, попутно, им же, корректируем угол наклона изображения (не всегда же страница журнала ложится в сканере именно так как надо)
  3. В зависимости от желтизны страницы пробуем подкорректировать цвета:
      а. Для титульных страниц (они обычно сохраняются лучше) делаем просто Brightness/Contrast. Параметры определяем по качеству результата. Этим самым убираем немного шумы.
      б. Для не титульных страниц (у них обычно бумага похуже) используем каналы, то есть, для каждого канала делаем свой Brightness/Contrast (тоже оцениваем результат визуально).
         ВНИМАНИЕ: Я здесь выставлял довольно жесткие значения, поэтому, изображения (фотографии) на страницах выделял и обрабатывал как в пункте а, тоесть слегонца, не используя каналов, дальше инвертировал выделение и накладывал отбеливание по каналах. Схемы же достаточно хорошо переживали жесткое "отбеливание" и от этого только выигрывали в своей четкости. Но опять таки - смотрим результат.
       
     ПРИМЕЧАНИЕ: Все это дело (корректировка), обычно одинаково для соответствующих страниц одного журнала, поэтому можно сохранить действия по "отбеливанию" в макрос (Actions).

     Я использовал следующие параметры (записанные в макросы):
      а. Макрос 1:
         - Brightness: +15, Contrast: +15
      б. Макрос 2:
         - Инвертирование выделения
         - Для красного канала Brightness: +18, Contrast: +18
         - Для зеленого канала Brightness: +25, Contrast: +25
         - Для голубого канала Brightness: +56, Contrast: +34
         - Для всех каналов Brightness: +30, Contrast: +30 (Этот пункт я добавил когда текст стал росвечивать на другую страницу)

     А дальше так:
       для титулок: Макрос 1
       для остальных страниц: выделяем фотографии - Макрос 1 - Макрос 2.

  4. Проделываем пункты 1-3 для всех страниц.

III. ВТОРИЧНАЯ ОБРАБОТКА, УВЕЛИЧЕНИЕ ДПИ
  1. Запускаем программу ScanKromsator.
  2. Открываем в ней все страницы одного журнала, помечаем их зелеными птичками.
  3. Выставляем такие настройки... (см. скриншоты).
  4. Запускаем выполнение.
  ПРИМЕЧАНИЕ: Увеличение дпи улутшает качество результата при кодировании в DjVu. Попутно, тут мы делаем все страницы одинакового размера.

IV. КОДИРОВАНИЕ
  1. Кодируем с помощью программы DjVu Solo 3.1, (Resolution 600, Scanned)
  ПРИМЕЧАНИЕ: Я пробовал кодировать Document Express 5 и 6 версий, но файлы для 600 дпи получались размером в 2 раза больше без особо заметного улутшения качества.
Наверх
 

Kak_eto_delayu_ya.zip (Вложенный файл удален)
WWW  
IP записан
 
Вадим
Администратор
*****
Вне Форума


Всем привет!

Сообщений: 1062
Россия
Пол: male
Re: DJVU
Ответ #15 - 02.12.2006 :: 19:56:17
 
Вадим писал(а) 02.12.2006 :: 19:31:49:
II. ПЕРВИЧНАЯ ОБРАБОТКА, "ОТБЕЛИВАНИЕ"
  1. Открываем страницу в графическом редакторе (я использовал Adobe Photoshop CS2)
  2. Инструментом 'Crop Tool' обрезаем лишнее, попутно, им же, корректируем угол наклона изображения (не всегда же страница журнала ложится в сканере именно так как надо)
  3. В зависимости от желтизны страницы пробуем подкорректировать цвета:
      а. Для титульных страниц (они обычно сохраняются лучше) делаем просто Brightness/Contrast. Параметры определяем по качеству результата. Этим самым убираем немного шумы.
      б. Для не титульных страниц (у них обычно бумага похуже) используем каналы, то есть, для каждого канала делаем свой Brightness/Contrast (тоже оцениваем результат визуально).
         ВНИМАНИЕ: Я здесь выставлял довольно жесткие значения, поэтому, изображения (фотографии) на страницах выделял и обрабатывал как в пункте а, тоесть слегонца, не используя каналов, дальше инвертировал выделение и накладывал отбеливание по каналах. Схемы же достаточно хорошо переживали жесткое "отбеливание" и от этого только выигрывали в своей четкости. Но опять таки - смотрим результат.        
     ПРИМЕЧАНИЕ: Все это дело (корректировка), обычно одинаково для соответствующих страниц одного журнала, поэтому можно сохранить действия по "отбеливанию" в макрос (Actions).
  4. Проделываем пункты 1-3 для всех страниц.

Мне кажется способ "отбеливания" страниц очень трудоемок.
Хочу привести самый простой, на мой взгляд, способ "отбеливания" в Фотошоп:

Подбор яркости и контрастности лучше сделать сразу в драйвере сканера перед началом сканирования.
После сканирования каждая страница отбеливается отдельно. Для этого нужно (для Фотошоп 5.5 рус) выбрать в верхнем меню "Выделить\Выделение по цвету..." В открывшемся окне задать "разброс" примерно около 100. Пипеткой кликнуть по желтой бумаге на скане таким образом, чтобы на полутоновом изображении в окне появилось максимальное количество белого там, где требуется разбеление. После этого жмем ОК. Выбираем в верхнем меню "Правка\Очистить". Все. Получаем почти белую страницу ("цвет фона" на панеле инструментов должен быть белым!). Дополнительно иногда требуется обработка краев. Для этого выделяем их рамкой и очищаем.
Наверх
 
WWW  
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5535
Екатеринбург
Пол: male
Re: DJVU
Ответ #16 - 03.03.2007 :: 13:05:54
 
при обработке Купинского столкнулся с неработоспособностью Соло: "Out of memory". Сосканил в 300 полноцвет, перевел букресторером в 600 (режим "коэффициент"), больше не обрабатывал. И вот - не хватает памяти...
Картинку в 300дпи прилагаю, но из-за объема перевел ее в JPG. Задняя обложка имеет ровный желтый цвет с ценой и значком издательства, и прошла сквозь Соло без проблем. Хотя сканировались обложки друг за другом без перенастроек сканера и путь обработки тот же.
Хотелось бы узнать - у меня одного такая проблема?
Наверх
 

sch101.rar (Вложенный файл удален)

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
Вадим
Администратор
*****
Вне Форума


Всем привет!

Сообщений: 1062
Россия
Пол: male
Re: DJVU
Ответ #17 - 04.03.2007 :: 00:24:28
 
AAW писал(а) 03.03.2007 :: 13:05:54:
при обработке Купинского столкнулся с неработоспособностью Соло: "Out of memory". Сосканил в 300 полноцвет, перевел букресторером в 600 (режим "коэффициент"), больше не обрабатывал. И вот - не хватает памяти...
Картинку в 300дпи прилагаю, но из-за объема перевел ее в JPG. Задняя обложка имеет ровный желтый цвет с ценой и значком издательства, и прошла сквозь Соло без проблем. Хотя сканировались обложки друг за другом без перенастроек сканера и путь обработки тот же.
Хотелось бы узнать - у меня одного такая проблема?

Перевел прикрепленный файл при помощи IrfanView в формат BMP 600dpi.
Соло нормально его обработал.
Может дело в количестве страниц в книге? Или может исходный файл был в одном из форматов TIFF?..
Наверх
 
WWW  
IP записан
 
pohorsky
Патриарх
*****
Вне Форума


Подключайтесь к проекту
"Вся МРБ"!!!

Сообщений: 5916
Москва
Пол: male
Re: DJVU
Ответ #18 - 04.03.2007 :: 07:35:35
 
Я проверил то же самое переводом JPG в tif - 600дпи.
Нормально конвертируется Соло.
Нужно проверить, конечно, исходный файл без конвертации в JPG.
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5535
Екатеринбург
Пол: male
Re: DJVU
Ответ #19 - 04.03.2007 :: 07:35:56
 
да, публиковал из букресторера в tiff... Это важно? О количестве: файл был один.
Но Соло и BMP не взял - сейчас так же как вы попробовал.
хм... может, у меня Соло "не тот" ? в справке "о программе" пишет версию 3.1, дата файла на диске - 08122000. В README написано "Non-сommercial version", а сама папка с установкой - "DjVu Solo 3.1a".
Не помню как ко мне попал дистрибутив, по-моему с купленным на DVD архивом Радио (по 2005ый, и я понадеялся что дистрибутив последний).

(Предварительный вывод - что-то с общим софтом на ПК, выходит? Раз и BMP не прошёл. Чёрт знает... ну, машина слабовата, 324 ОЗУ, своппинг настроен на полных 790. Другие параметры ему, Соло, должны быть до лампочки. Попробую своп увеличить, пик после пробы в Соло диспетчер задач показывает аж 740, с базового уровня 190. Но это перегружаться нужно.)
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5535
Екатеринбург
Пол: male
Re: DJVU
Ответ #20 - 04.03.2007 :: 07:40:59
 
добавлю: сделанный tiff пробовал конвертнуть в JPG и скормить Соло. Бесполезно.
винда 2000 sp4.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5535
Екатеринбург
Пол: male
Re: DJVU
Ответ #21 - 14.03.2007 :: 11:37:17
 
попробовал увеличить своп. не помогло. плохо.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
Lykas
Патриарх
*****
Вне Форума


Всем привет!

Сообщений: 1121
Re: DJVU
Ответ #22 - 14.03.2007 :: 14:22:05
 
AAW писал(а) 04.03.2007 :: 07:35:56:
(Предварительный вывод - что-то с общим софтом на ПК, выходит? Раз и BMP не прошёл. Чёрт знает... ну, машина слабовата, 324 ОЗУ, своппинг настроен на полных 790. Другие параметры ему, Соло, должны быть до лампочки.

Паковал в DJVU на 256 ОЗУ, процессор 800 МГц - все шло нормально. Правда намного дольше чем сейчас, но без ошибок. Была версия DjVu Solo 3, DjVu Solo 3.1.
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5535
Екатеринбург
Пол: male
DJVU и 300 дпи
Ответ #23 - 15.03.2007 :: 08:28:06
 
к вопросу применения технологии 4u4undr - 300 дпи серым и удвоение разрешения.
что специалистам по дежавюированию удастся сохранить из приложенных файлов? мои попытки были крайне неуспешными, распечатанный djvu-результат разительно отличается от оригинала. (В архив вложен вчерашний ночной экспериментальный djvu с исходниками в 300 и 400,приведенными к 600, и 600 дпи. Но! скан был на другом сканере, домашнем, того скана с собой нет. скан был похуже, не такой контрастный - лампа старая.) Файл 16,8 Мб.
Интересуют настройки процесса.
Наверх
 

trans300.rar (Вложенный файл удален)

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
pohorsky
Патриарх
*****
Вне Форума


Подключайтесь к проекту
"Вся МРБ"!!!

Сообщений: 5916
Москва
Пол: male
Re: DJVU
Ответ #24 - 15.03.2007 :: 20:42:04
 
Вот, что у меня получилось.
Кое-где есть огрехи, но, кажется, знаю как исправить.
Наверх
« Последняя редакция: 16.03.2007 :: 19:05:39 от pohorsky »  

Image-test.rar (Вложенный файл удален)
 
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5535
Екатеринбург
Пол: male
Re: DJVU
Ответ #25 - 16.03.2007 :: 12:19:28
 
лихо... я в замешательстве - как это стало возможным?.. ведь практически идентично!
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
pohorsky
Патриарх
*****
Вне Форума


Подключайтесь к проекту
"Вся МРБ"!!!

Сообщений: 5916
Москва
Пол: male
Re: DJVU
Ответ #26 - 16.03.2007 :: 17:38:36
 
Немного доработаю методику и постараюсь описать.
В принципе, по отдельности приёмы описаны. И на этом форуме, в основном, Минором, и в других местах.
Постараюсь обобщить и выделить главное.
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5535
Екатеринбург
Пол: male
Re: DJVU
Ответ #27 - 17.03.2007 :: 19:22:05
 
жаль, поздно я пришел на форум - многое в архивах, надо вчитываться. а это не совсем то что было при переписке - время по-другому идет.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5535
Екатеринбург
Пол: male
Re: DJVU
Ответ #28 - 29.03.2007 :: 07:29:22
 
пример для balabol
Наверх
 

00.rar (Вложенный файл удален)

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
pohorsky
Патриарх
*****
Вне Форума


Подключайтесь к проекту
"Вся МРБ"!!!

Сообщений: 5916
Москва
Пол: male
Re: DJVU
Ответ #29 - 29.03.2007 :: 16:53:20
 
pohorsky писал(а) 15.03.2007 :: 20:42:04:
Вот, что у меня получилось.
Кое-где есть огрехи, но, кажется, знаю как исправить.


Цитата:
Немного доработаю методику и постараюсь описать.
В принципе, по отдельности приёмы описаны. И на этом форуме, в основном, Минором, и в других местах.
Постараюсь обобщить и выделить главное.


Цитирую сам себя и выполняю обещанное.
    AAW прислал три разворота книги (шесть станиц) отсканированные в сером с иллюстрациями (фотографиями). Здесь их не прицепляю, т.к. даже в сжатом виде - 50МБ.
    Идея простая – чтобы получить качественный DJVU без разводов, смахивающих на подмоченную акварель, нужно применять только режим Bitonal (режим Photo здесь не рассматриваем).
Чтобы применять этот режим, нужно иметь ч/б сканы, где все серые картинки были бы в виде ч/б растра, например, в виде поля точек разного размера и густоты.
    Самый простой и надежный способ получить такие сканы  – это сразу сканировать в ч/б режиме и 600 дпи, предварительно подобрав оптимальный режим сканирования (плотность), правда, эта оптимальная плотность может быть разной для текста и картинок, тогда приходится сканировать дважды текст отдельно, а картинки отдельно.
    В нашем случае мы уже имеем готовые серые сканы, причем графический редактор RasterID сообщил, что разрешение всего 72дпи, и FR тоже возмутился низким разрешением, хотя «на глаз» - не меньше трехсот.
Кстати, пытался Кромсатором сразу нарезать на страницы нужного размера и заодно перевести в 600 дпи –серое, но не получилось, ругается. Пришлось немного отступить от наезженной тропы.
    Дальше действия были такие.
    Перевел в тиф  600дпи серое с помощью RasterID и нарезал Кромсатором на станицы – на выходе тоже получил несжатые тифы 600 дпи серое (их сохранил в отдельной папке – потом пригодятся, будем вырезать из них картинки).
    Отдал все страницы  в FR8, только для того, что бы получить из серых  ч/б-станицы. FR8 это делает адаптивно, т.е. учитывает неравномерность яркости по странице (кстати, поэтому ему лучше отдавать серые страницы с максимально обрезанными черными полями, если таковые есть).
    Дальше посмотрел эти страницы в ч/б варианте, чистить автоматом не стал, поскольку есть мелкие нужные точки, и сохранил, как ч/б многостраничный тиф.
Вот что получилось, например, из первой страницы.
Продолжение после перекура.
Наверх
« Последняя редакция: 29.03.2007 :: 17:05:03 от pohorsky »  

252b.rar (Вложенный файл удален)
 
IP записан
 
Страниц: 1 2 3 ... 10
Послать Тему Печать