OCR форумы Добро пожаловать, Гость. Пожалуйста, выберите Вход или Регистрация
Всем привет!
Hi all!
 
  ГлавнаяСправкаПоискВходРегистрация Администратор Библиотека  
 
Переключение на Главную Страницу Страниц: 1
Послать Тему Печать
Как правильно кодировать цветные заголовки? (Прочитано 20674 раз)
nbl
Гуру
****
Вне Форума



Сообщений: 502
Кузбасс
Пол: male
Как правильно кодировать цветные заголовки?
23.01.2012 :: 05:00:02
 
dns писал(а) 22.01.2012 :: 19:07:02:
Уточняю: цветные подзаголовки недостаточно высокого качества.

Можно я в связи с этим технический вопрос подниму? Как правильно кодировать цветные заголовки/подзаголовки? Насколько я заметил, сейчас, как правило, кодируют в DjVu так, что такие заголовки уходят в слой background. Соответственно, при кодировании они несколько размываются. Если же кодировать так, чтобы они попадали в слой foreground, то качество их будет таким же отличным, как у основного текста. Однако по моему мнению, ни СканКромсатор, ни СканТейлор в настоящее время не позволяют автоматизированным способом получать субсканы в цветными заголовками в слое foreground. Я сейчас обрабатываю цветные заголовки, как обычный текст, т.е. они получаются черными, а потом после разделения на субсканы раскрашиваю заголовки и другие одноцветные элементы в нужный цвет. Если цветных элементов много, то раскрашивать будет муторно. Может я чего-то не вижу и процесс таки можно автоматизировать? Или это я слишком много хочу и никому больше такое не нужно? Хотелось бы услышать мнение коллег. А также хотелось бы услышать мнение bolega по поводу вот такого предложения. В СканКоромсаторе в свойствах picture зоны сделать чекбокс, установка которого при операции merge zones отправляла бы зону в слой foreground принудительно.
Наверх
« Последняя редакция: 24.01.2012 :: 20:18:29 от Dmitry7 »  
 
IP записан
 
dns
Гуру
****
Вне Форума


Всем привет!

Сообщений: 942
Красноярск
Пол: male
Re: серия Учёные - школьнику
Ответ #1 - 23.01.2012 :: 09:29:46
 
Насколько я понимаю, простой перенос в фореграунд проблемы не решит, там же битонал, нужно задавать маску.

Есть такой
метод выборочной раскраски маски
:

http://www.djvu-soft.narod.ru/scan/sel_mask_color.htm

Похоже то, что нужно, только вот очень уж сложное шаманство. Одну страницу так сделать можно, а вот книгу собрать...
Наверх
 
 
IP записан
 
Lykas
Патриарх
*****
Вне Форума


Всем привет!

Сообщений: 1129
Re: серия Учёные - школьнику
Ответ #2 - 23.01.2012 :: 10:00:41
 
dns писал(а) 23.01.2012 :: 09:29:46:
Насколько я понимаю, простой перенос в фореграунд проблемы не решит, там же битонал, нужно задавать маску.

Есть такой
метод выборочной раскраски маски
:

http://www.djvu-soft.narod.ru/scan/sel_mask_color.htm

Похоже то, что нужно, только вот очень уж сложное шаманство. Одну страницу так сделать можно, а вот книгу собрать...

Где-то видел программу для раскраски уже готового ч\б Djvu...

В сканах: Басов Световое чудо века.
Наверх
« Последняя редакция: 23.01.2012 :: 10:07:18 от Lykas »  
 
IP записан
 
bolega
Гуру
****
Вне Форума



Сообщений: 781
Re: серия Учёные - школьнику
Ответ #3 - 23.01.2012 :: 11:01:01
 
nbl писал(а) 23.01.2012 :: 05:00:02:
В СканКоромсаторе в свойствах picture зоны сделать чекбокс, установка которого при операции merge zones отправляла бы зону в слой foreground принудительно.

В СК все зоны, включая ч/б, поддерживают раскраску текста и фона. Никакого чекбокса не надо. В последней версии СК (в которой СК сам генерит djvu), он автоматически раскрашивает эти зоны (т.е. цветной текст) с помощью специального djvu-чанка, оставляя текст в foreground (а точнее, в маске, т.к. foreground - тоже цветной слой). В отличие от djvu-pal, СК не имеет одного его недостатка: в некторых случаях (при  раскраске крупных участков) djvu-pal раскрашивает некорректно, окрашивая и куски ближлежайшего текста. Виноват тут не djvu-pal, а особенность djvu, когда в один блит (это наименьший атом черного контента страницы, и соответственно, раскраски) попадает не один, а несколько символов, или даже их кусков. СК такие случаи автоматически детектирует и предпринимает соответствующие меры: раскодирует ч/б слой djvu, находит блиты с потенциально-неверной  смешанной раскраской, расщепляет их и снова кодирует в djvu. Кстати, это позволяет СК раскрашивать даже один блит (например, букву) в разные цвета (напр., верх -синий, низ - красный). djvu-pal такое не умеет.
Выше под раскордированием/кодированием понимается  не извлечение из djvu графики (bmp) и обратная операция, а работа СК непосредственно с внутренними структурами djvu слоев.
Наверх
« Последняя редакция: 23.01.2012 :: 11:23:53 от bolega »  
 
IP записан
 
dns
Гуру
****
Вне Форума


Всем привет!

Сообщений: 942
Красноярск
Пол: male
Re: серия Учёные - школьнику
Ответ #4 - 23.01.2012 :: 11:31:13
 
bolega, спасибо за пояснения, все оказалось достаточно просто.
Наверх
 
 
IP записан
 
nbl
Гуру
****
Вне Форума



Сообщений: 502
Кузбасс
Пол: male
Re: серия Учёные - школьнику
Ответ #5 - 23.01.2012 :: 13:08:25
 
Спасибо за пояснения. Я так понял, все они работают, если делать кодирование в DjVu из самого Кромсатора? А как получить на выходе Кромсатора субканы для кодирования связкой DjVu Small + DjVu Imager? В этом случае в background-субскане должны остаться только полутоновые элементы цветные и плашки под текстом, а в foreground-субскане текст и другие однотонные цветные элементы.
Наверх
« Последняя редакция: 23.01.2012 :: 17:56:28 от nbl »  
 
IP записан
 
pohorsky
Патриарх
*****
Вне Форума


Подключайтесь к проекту
"Вся МРБ"!!!

Сообщений: 5916
Москва
Пол: male
Re: серия Учёные - школьнику
Ответ #6 - 23.01.2012 :: 14:24:07
 
bolega писал(а) 23.01.2012 :: 11:01:01:
В последней версии СК (в которой СК сам генерит djvu)


Не подскажете, где взять последнюю версию СК.
Наверх
 
 
IP записан
 
nbl
Гуру
****
Вне Форума



Сообщений: 502
Кузбасс
Пол: male
Re: серия Учёные - школьнику
Ответ #7 - 23.01.2012 :: 14:44:54
 
pohorsky писал(а) 23.01.2012 :: 14:24:07:
Не подскажете, где взять последнюю версию СК.

http://forum.ru-board.com/topic.cgi?forum=5&topic=29984&start=1280#3

http://www.onlinedisk.ru/file/734333/
Наверх
 
 
IP записан
 
dns
Гуру
****
Вне Форума


Всем привет!

Сообщений: 942
Красноярск
Пол: male
Re: серия Учёные - школьнику
Ответ #8 - 23.01.2012 :: 15:21:01
 
nbl писал(а) 23.01.2012 :: 13:08:25:
Спасибо за пояснения. Я так понял все они работают, если делать кодирование в DjVu из самого Кромсатора? А как получить на выходе Кромсатора субканы для кодирования связкой DjVu Small + DjVu Imager? В этом случае в background-субскане должны остаться только полутоновые элементы цветные плашки под текстом, а в foreground-субскане текст и другие однотонные цветные элементы.

Цветной текст можно загнать в foreground вместе с черным, потом раскрасить черный текст в готовом djvu.

http://www.djvu-soft.narod.ru/soft/djvu_pal_v1_1.rar
Наверх
 
 
IP записан
 
bolega
Гуру
****
Вне Форума



Сообщений: 781
Re: серия Учёные - школьнику
Ответ #9 - 23.01.2012 :: 16:51:42
 
nbl писал(а) 23.01.2012 :: 13:08:25:
Спасибо за пояснения. Я так понял все они работают, если делать кодирование в DjVu из самого Кромсатора? А как получить на выходе Кромсатора субканы для кодирования связкой DjVu Small + DjVu Imager? В этом случае в background-субскане должны остаться только полутоновые элементы цветные плашки под текстом, а в foreground-субскане текст и другие однотонные цветные элементы.


Субсканы можно получить командой Merge zones (с включенной опцией create separate files). Но отдельно субсканов для раскрашенного текста не предусмотрено, т.к. нет утилиты, которая могла бы с этим что-нибудь делать. Лично я знаю только две утилиты, которые могут раскрашивать текст: djvu_pal и СК, причем djvu_pal раскрашивает только готовый djvu.
Наверх
 
 
IP записан
 
bolega
Гуру
****
Вне Форума



Сообщений: 781
Re: серия Учёные - школьнику
Ответ #10 - 23.01.2012 :: 16:57:20
 
dns писал(а) 23.01.2012 :: 15:21:01:
Цветной текст можно загнать в foreground вместе с черным, потом раскрасить черный текст в готовом djvu.

Да, так и делается в случае djvu_pal. Я только не знаю, как это делается в СТ для бледных цветов, напр., для желтого текста. При бинаризации страницы порог, который выбирается для черного, может "убить" весь желтый цвет. В СК с этим проблем нет, для зоны можно задавать индивидуальный порог, а чаще достаточно задать просто Auto. А в СТ можно задавать свой порог для ограниченного участка страницы?

pohorsky
Свежие версии всегда есть в шапке форума
http://forum.ru-board.com/topic.cgi?forum=5&topic=29984&start=1480
Хочу предупредить, что последняя версия в бета-стадии. Я уже получил много сообщений о багах.
Наверх
« Последняя редакция: 23.01.2012 :: 17:06:32 от bolega »  
 
IP записан
 
nbl
Гуру
****
Вне Форума



Сообщений: 502
Кузбасс
Пол: male
Re: серия Учёные - школьнику
Ответ #11 - 23.01.2012 :: 17:45:47
 
bolega писал(а) 23.01.2012 :: 16:51:42:
Субсканы можно получить командой Merge zones (с включенной опцией create separate files). Но отдельно субсканов для раскрашенного текста не предусмотрено, т.к. нет утилиты, которая могла бы с этим что-нибудь делать. Лично я знаю только две утилиты, которые могут раскрашивать текст: djvu_pal и СК, причем djvu_pal раскрашивает только готовый djvu.

Субсканы, о которых я говорил, можно закодировать программой DjVu Sep. Но я использую DjVu Small, только я в него добавил вот такие профили:

#@displayName:NBL BW (600 dpi)
nbl_600: very-aggressive300
dpi=-600
shape-filter-level=0

#@displayName:NBL BW (300 dpi)
nbl_300: very-aggressive300
dpi=-300
shape-filter-level=0

Вот поэтому хотелось бы зоны с цветным текстом отправлять при операции Merge Zones (с включенной опцией create separate files) в субскан переднего плана.
Наверх
« Последняя редакция: 23.01.2012 :: 17:52:36 от nbl »  
 
IP записан
 
bolega
Гуру
****
Вне Форума



Сообщений: 781
Re: серия Учёные - школьнику
Ответ #12 - 23.01.2012 :: 20:23:25
 
nbl
А, вот Вы о чем. Т.е. чтобы в sep-файл попадали бы только текст, ч/б и раскрашенный. Без прочих зон, если они есть. Так?
Djvusep - это отдельная песня. Малоцветное кодирование у меня тоже есть в планах, только пока у меня нет надежного алгоритма квантования цветов. Раскраска - это тоже квантование, толко ручное и часто довольно нудное.
Наверх
 
 
IP записан
 
nbl
Гуру
****
Вне Форума



Сообщений: 502
Кузбасс
Пол: male
Re: Как правильно кодировать цветные заголовки?
Ответ #13 - 24.01.2012 :: 04:38:58
 
В целом, Вы правильно поняли. Только наоборот, в sep файл идут полутоновые и цветные иллюстрации и фоновые цветные плашки под текстом, а в основной файл идет текст черный и цветной и одноцветный line-art.

Чтобы проиллюстрировать свои хотелки я сделал поясняющие картинки. Они вот в этом архиве:
http://www.onlinedisk.ru/file/811326/

Пояснение по файлам в архиве:
0001.tif — передний субскан, содержит текст черный и цветной и одноцветные цветные фигуры;
0001.sep.tif — субскан заднего фона, содержит многоцветную картинку и одноцветную плашку под текст;
"DjVu after Small.djvu" — передний субскан после кодирования файла 0001.tif программой "DjVu Small" с профилем "NBL BW (600 dpi)";
"DjVu after Imager.djvu" — задний субскан после кодирования файла 0001.sep.tif программой "DjVu Imager";
"DjVu Encoded.out.djvu" — результирующий файл после внедрения задних субсканов в файл передних субсканов программой "DjVu Imager".
Наверх
 
 
IP записан
 
bolega
Гуру
****
Вне Форума



Сообщений: 781
Re: Как правильно кодировать цветные заголовки?
Ответ #14 - 24.01.2012 :: 14:38:37
 
Понятно. Я подумаю.
Интересно, почему после внедрения задних субсканов dpi BG44-слоя меняется со 100 на 75?? Размеры при этом остаются прежними.
Только скажите, какие преимущества у раскраски с помощью Вашего профиля перед прямой раскраской?
Наверх
 
 
IP записан
 
nbl
Гуру
****
Вне Форума



Сообщений: 502
Кузбасс
Пол: male
Re: Как правильно кодировать цветные заголовки?
Ответ #15 - 24.01.2012 :: 16:05:40
 
bolega писал(а) 24.01.2012 :: 14:38:37:
Интересно, почему после внедрения задних субсканов dpi BG44-слоя меняется со 100 на 75?? Размеры при этом остаются прежними.

Тут я не смогу сказать. Это надо спрашивать, скорее всего, у Monday2000. Как автор, он, возможно, прояснит этот момент.

bolega писал(а) 24.01.2012 :: 14:38:37:
Только скажите, какие преимущества у раскраски с помощью Вашего профиля перед прямой раскраской?

Лично для меня, преимущество в том, что все кодирование происходит по типовой схеме для связки "DjVu Small" + "DjVu Imager". Проблема в подготовке субсканов. У меня даже мысль промелькнула, что неплохо было бы доработать "CT Split", чтобы он в передний субскан не только черные, но и другие одноцветные области выгружал. Только у меня самого запала на решение этой задачки не хватит.

Насчет разницы по внутреннем устройстве результирующего DjVu, закодированного по этой технологии, или раскрашенного с помощью "DjVu Pal" я тоже не могу ничего сказать.

Ну, и в моих знания есть большой недостаток, я несколько отошел от СканКромсатора, и пока не научился кодировать DjVu с помощью него, да и многие его возможности я применять не умею  Смущённый
Наверх
 
 
IP записан
 
Pobat
Новичок
*
Вне Форума


Всем привет!

Сообщений: 5
Re: серия Учёные - школьнику
Ответ #16 - 14.11.2013 :: 08:59:04
 
bolega писал(а) 23.01.2012 :: 11:01:01:
В СК все зоны, включая ч/б, поддерживают раскраску текста и фона. Никакого чекбокса не надо. В последней версии СК (в которой СК сам генерит djvu), он автоматически раскрашивает эти зоны (т.е. цветной текст) с помощью специального djvu-чанка, оставляя текст в foreground (а точнее, в маске, т.к. foreground - тоже цветной слой). В отличие от djvu-pal, СК не имеет одного его недостатка: в некторых случаях (при  раскраске крупных участков) djvu-pal раскрашивает некорректно, окрашивая и куски ближлежайшего текста. Виноват тут не djvu-pal, а особенность djvu, когда в один блит (это наименьший атом черного контента страницы, и соответственно, раскраски) попадает не один, а несколько символов, или даже их кусков. СК такие случаи автоматически детектирует и предпринимает соответствующие меры: раскодирует ч/б слой djvu, находит блиты с потенциально-неверной  смешанной раскраской, расщепляет их и снова кодирует в djvu. Кстати, это позволяет СК раскрашивать даже один блит (например, букву) в разные цвета (напр., верх -синий, низ - красный). djvu-pal такое не умеет.
Выше под раскордированием/кодированием понимается  не извлечение из djvu графики (bmp) и обратная операция, а работа СК непосредственно с внутренними структурами djvu слоев.

Прошу прощения, можно ли как то подробнее описать процесс создания djvu c раскраской. Все мои попытки закончились неудачей.
И тут вопрос в том то ли : а) у меня не хватает нужных библиотек для кодирования DJVU в SK и б) то ли я не совсем точно понял про выделения цветного текста в зонах и выделяю зоны не так и не те.
Можете описать порядок - мини хэлпик такой
Использую v5.96.2
Наверх
 
 
IP записан
 
Dmitry7
Модератор
*****
Вне Форума


Соберем Серии "НВЖНиТ"!

Сообщений: 5935
Санкт-Петербург
Пол: male
Re: серия Учёные - школьнику
Ответ #17 - 14.11.2013 :: 17:18:26
 
Pobat писал(а) 14.11.2013 :: 08:59:04:
Прошу прощения, можно ли как то подробнее описать процесс создания djvu c раскраской. Все мои попытки закончились неудачей.
И тут вопрос в том то ли : а) у меня не хватает нужных библиотек для кодирования DJVU в SK и б) то ли я не совсем точно понял про выделения цветного текста в зонах и выделяю зоны не так и не те.
Можете описать порядок - мини хэлпик такой
Использую v5.96.2

а Вы устанвливаете в свойствах выделения области "b/w" цвет?  многие это забывают.

и здесь гляньте
http://forum.ru-board.com/topic.cgi?forum=5&topic=29984&start=1980
Наверх
« Последняя редакция: 14.11.2013 :: 18:24:47 от Dmitry7 »  

"Если хочешь сделать что-то хорошо, сделай это сам!"
332371574  
IP записан
 
Pobat
Новичок
*
Вне Форума


Всем привет!

Сообщений: 5
Re: серия Учёные - школьнику
Ответ #18 - 15.11.2013 :: 09:12:17
 
Dmitry7 писал(а) 14.11.2013 :: 17:18:26:
а Вы устанвливаете в свойствах выделения области "b/w" цвет?  многие это забывают.

Нет, я не знал про это. Подскажите как?
Интуитивно предрасполагаю что  правой кнопкой мышки по зоне, где то в этом меню?
...

Dmitry7 писал(а) 14.11.2013 :: 17:18:26:
и здесь гляньте
http://forum.ru-board.com/topic.cgi?forum=5&topic=29984&start=1980
читаю второй день в перерывах на работе. Улыбка
Наверх
 
 
IP записан
 
Dmitry7
Модератор
*****
Вне Форума


Соберем Серии "НВЖНиТ"!

Сообщений: 5935
Санкт-Петербург
Пол: male
Re: серия Учёные - школьнику
Ответ #19 - 15.11.2013 :: 22:53:53
 
Pobat писал(а) 15.11.2013 :: 09:12:17:
Нет, я не знал про это. Подскажите как?


щелкаете 2 раза левой кнопкой на выделении со свойствами "изображение"
Откроется страница настроек - там увидите
Наверх
 

"Если хочешь сделать что-то хорошо, сделай это сам!"
332371574  
IP записан
 
Pobat
Новичок
*
Вне Форума


Всем привет!

Сообщений: 5
Re: Как правильно кодировать цветные заголовки?
Ответ #20 - 17.11.2013 :: 16:25:18
 
Dmitry7 спасибо
Я так понял речь идет о picture зоне, потому что bw-zone никаких левой кнопки мыши свойств не открывает
1.открывают третью закладку в пиктур зоне - левой кнопкой мыши
...

2.Текст выставлю - цвет пусть красный
...

3. ...
Создать Djvu

4.
4.1 Attach auto
4.2 Run all steps
...
и ничего - чб djvu
...

где я свернул не туда.



Наверх
 
 
IP записан
 
Dmitry7
Модератор
*****
Вне Форума


Соберем Серии "НВЖНиТ"!

Сообщений: 5935
Санкт-Петербург
Пол: male
Re: Как правильно кодировать цветные заголовки?
Ответ #21 - 18.11.2013 :: 19:21:48
 
Pobat писал(а) 17.11.2013 :: 16:25:18:
где я свернул не туда.?

вкладку Filters забыли? (между 1й и 2й вашими картинками)
Попробуйте с такой настройкой:

Надо выставить "despeckle" так: (галку и Fine)
...


Наверх
 

"Если хочешь сделать что-то хорошо, сделай это сам!"
332371574  
IP записан
 
bolega
Гуру
****
Вне Форума



Сообщений: 781
Re: Как правильно кодировать цветные заголовки?
Ответ #22 - 18.11.2013 :: 20:48:07
 
Pobat писал(а) 17.11.2013 :: 16:25:18:
где я свернул не туда.


К сожалению, описывать весь процесс - долго. Поэтому буду краток. Для создания djvu с помощью СК нужно пройти две стадии. 1-я - обработка сканов. Именно здесь задаются зоны, которые после обработки станут раскрашенными. 2-я стадия - создание out-задания (команда Files->Create out-task) из исходного задания. В out-задании ничего не обрабатывается, а только дается команда создания djvu (или pdf).
Но есть и хорошая новость. Если нужно раскрасить уже ч/б изображения (как в вашем случае), то обработку можно и не делать. Ведь для раскраски djvu главное условие - ч/б изображения - уже выполнено. Поэтому на закладке свойств зоны нужно выбрать Color не B/W, а Special! В остальном у вас все правильно. По сути Special - это и есть признак раскрашенной зоны, которую СК учтет при создании djvu. Кстати, все другие опции будут проигнорированы, они автоматом заблокируются при выборе Color=Special.
Если же все-таки будет нужда применить какие-то фильтры для зон, то придется выполнить обработку задания, т.е. применить две стадии как я и упомянул выше
Наверх
« Последняя редакция: 18.11.2013 :: 20:55:04 от bolega »  
 
IP записан
 
Переключение на Главную Страницу Страниц: 1
Послать Тему Печать