OCR форумы Добро пожаловать, Гость. Пожалуйста, выберите Вход или Регистрация
Всем привет!
Hi all!
 
  ГлавнаяСправкаПоискВходРегистрация Администратор Библиотека  
 
Переключение на Главную Страницу Страниц: 1
Послать Тему Печать
Тонированная бумага (Прочитано 18146 раз)
mor
Патриарх
*****
Вне Форума



Сообщений: 1769
Пол: male
Тонированная бумага
15.06.2015 :: 20:59:54
 
Впервые столкнулся с тем, что вся книга напечатана на тонированной бумаге (желтой). При стандартной обработке на итоговой ч/б странице сделал замену всего белого цвета на желтый - размер страницы при кодировании в DjVu вырос в 20 раз. Что можно с этим сделать?
исходная страница
...
белый фон заменен на желтый
...
Наверх
 
 
IP записан
 
joker2156
Активист
***
Вне Форума



Сообщений: 306
Re: Тонированная бумага
Ответ #1 - 16.06.2015 :: 04:37:35
 
Может какой из редакторов умеет подкладывать фон на каждую страницу? (не уверен есть ли такая возможность в самом формате). А так вроде что-то подобное обсуждалось и еще где-то я писал (не могу найти) что, на мой взгляд, было бы гораздо удобнее, если бы в стандарте djvu было не черно-белый, а черно-второй цвет. Ну и последний вариант, который я так толком и не освоил - "разделенные сканы" - для каждой страницы делать желтую подложку с "вычтенными" буквами.
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
На Форуме


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5567
Екатеринбург
Пол: male
Re: Тонированная бумага
Ответ #2 - 16.06.2015 :: 06:42:12
 
Я конечно далеко не спец в кодировании. Но тут намедни баловался с малоцветными страницами, rasterID мучал, а потом профиль Экстремальные/малоцветное кодирование в Djvu Small Mod. И обратил внимание, что DSM почему-то далеко не всегда включает размазывание словаря. То есть подсовываешь ему 128 одинаковых (идентичных) страниц, словарь ставишь 100, а "фиг вам" - каждая страница кодируется сугубо индивидуально и занимает 231кб. При том, что другой профиль даёт на том же примере 2,7кб (!!). В чём дело я так и не разобрался, но отметил этот странный факт. Я к чему пишу: мне каким-то образом удалось добиться, что словарь стал размазываться, но поскольку это был побочный результат, волшебную последовательность я не зафиксировал. Может, у вас цветные страницы кодируются без использования общего словаря, и туда стоит обратить внимание?
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
AlVaKo
Гуру
****
Вне Форума



Сообщений: 576
Алма-Ата
Пол: male
Re: Тонированная бумага
Ответ #3 - 16.06.2015 :: 09:23:22
 
Какой кодировщик использует Djvu Small Mod, не знаю. Могу сказать про использование кодировщика от виртуального принтера(msepdjvu). У msepdjvu, для малоцветных страниц словарь символов  создавался только когда у всех страниц описание цветов для символов полностью совпадало.

Допустим, хотим закодировать 20 страниц, словарь символов на 20 страниц. Из них 18 страниц содержат только черные символы, одна страница содержит черные и красные символы, и ещё одна страница имеет черные и синие символы. Так вот, все эти страницы надо кодировать как имеющие в своем составе три цвета; черный, красный, синий.
Наверх
 

Сложно отбинаризировать черную перемычку на белой бумаге, особенно если её там нет.
 
IP записан
 
AAW
Патриарх
*****
На Форуме


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5567
Екатеринбург
Пол: male
Re: Тонированная бумага
Ответ #4 - 16.06.2015 :: 09:49:25
 
AlVaKo писал(а) 16.06.2015 :: 09:23:22:
эти страницы надо кодировать как имеющие в своем составе три цвета

А можно поподробнее, как (и кто, и кому/чему) указать, что три цвета есть на странице с двумя фактическими цветами?? Незаметную точку с третьим цветом вставлять? Или в строке параметров, или в софте в GUI есть место?
Или хоть первоисточник знаний дайте, пожалуйста.
p.s. DSM вроде бы тоже вызывает msepdjvu. Но это неточная информация.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
AlVaKo
Гуру
****
Вне Форума



Сообщений: 576
Алма-Ата
Пол: male
Re: Тонированная бумага
Ответ #5 - 16.06.2015 :: 10:13:28
 
Источник знаний собственный опыт работы с msepdjvu. Кодировал как то электронный документ из издательского PDF, там этих цветов было штук восемь(если не больше).

Про DSM лишь мои догадки. Если DSM на ходу, по мере поступления сканов, анализирует встречающиеся цвета, то msepdjvu скорее всего не создаст словарь.
Как извращение, на всех сканах поставить малозаметные цветные точки. Поставить в верхнем левом углу, до всех символов текста. Их количество и порядок и цвет должны быть одинаковыми на всех сканах.
Наверх
 

Сложно отбинаризировать черную перемычку на белой бумаге, особенно если её там нет.
 
IP записан
 
nbl
Гуру
****
Вне Форума



Сообщений: 502
Кузбасс
Пол: male
Re: Тонированная бумага
Ответ #6 - 16.06.2015 :: 15:54:10
 
joker2156 писал(а) 16.06.2015 :: 04:37:35:
Ну и последний вариант, который я так толком и не освоил - "разделенные сканы" - для каждой страницы делать желтую подложку с "вычтенными" буквами.

Как по мне, то это самый верный вариант. Страницы с текстом надо оставить черно-белыми и кодировать их в битонале. Это будет передний субскан. На каждую страницу надо сделать второй субскан, который будет состоять из цветного фона. Кодировать в DjVu Imager. ДЗФ=12, качество фона = 0 — это если фон однотонный. Если там будет текстура, то параметры должны быть другие, чтобы ее сохранить.
Наверх
 
 
IP записан
 
Dmitry7
Модератор
*****
Вне Форума


Соберем Серии "НВЖНиТ"!

Сообщений: 5935
Санкт-Петербург
Пол: male
Re: Тонированная бумага
Ответ #7 - 16.06.2015 :: 20:43:35
 
nbl писал(а) 16.06.2015 :: 15:54:10:
На каждую страницу надо сделать второй субскан, который будет состоять из цветного фона. .

а можно поподробнее, как?
Наверх
 

"Если хочешь сделать что-то хорошо, сделай это сам!"
332371574  
IP записан
 
nbl
Гуру
****
Вне Форума



Сообщений: 502
Кузбасс
Пол: male
Re: Тонированная бумага
Ответ #8 - 16.06.2015 :: 20:56:04
 
Dmitry7 писал(а) 16.06.2015 :: 20:43:35:
а можно поподробнее, как?

Очень просто. Копируем любую страницу с текстом в другой файл. Удаляем на ней все, что есть, и заливаем нужным цветом. Полученную страницу с фоном копируем столько раз, сколько страниц в книге.
Наверх
 
 
IP записан
 
AlVaKo
Гуру
****
Вне Форума



Сообщений: 576
Алма-Ата
Пол: male
Re: Тонированная бумага
Ответ #9 - 16.06.2015 :: 21:23:34
 
Три года назад выкладывал GUI для msepdjvu. Там можно было окрашивать фон для битональных сканов, без всяких субсканов. Но народу больше нравяться субсканы.

....
И вроде как Djvu Small Mod тоже может окрашивать фон.
Наверх
« Последняя редакция: 16.06.2015 :: 22:23:58 от AlVaKo »  

Сложно отбинаризировать черную перемычку на белой бумаге, особенно если её там нет.
 
IP записан
 
mor
Патриарх
*****
Вне Форума



Сообщений: 1769
Пол: male
Re: Тонированная бумага
Ответ #10 - 16.06.2015 :: 23:26:09
 
AlVaKo
так с заменой цвета фона никаких проблем нет, в файле остается 2 уникальных цвета. Но размер при кодировании (с помощью msepdjvu) вырастает в 20 раз.

Способ с переносом фона в background и раздельного кодирования работает. Для примера залил 3 варианта одной страницы:
http://ovrload.ru/f/55181_fsd11.djvu

1-я - все в foreground
2-я - исходная страница
3-я - фон перенесен в background с делителем 10

Но вообще я склоняюсь к тому, чтобы не сохранять тонирование в электронном варианте.
Наверх
 
 
IP записан
 
AlVaKo
Гуру
****
Вне Форума



Сообщений: 576
Алма-Ата
Пол: male
Re: Тонированная бумага
Ответ #11 - 17.06.2015 :: 08:42:05
 
Не совсем понимаю, зачем цветную бумагу кодировать в маске. Само собой размер будет большой, и словарь не спасет. Если в книге текст только черный, и обработчик желает сохранить цвет бумаги, то я бы поступил так, обработал до черно-белого битонала, а при кодировке в msepdjvu окрасил фон в желаемый цвет. Без всяких подкладываний.

Окрашивать или не окрашивать, решать обработчику. В одной детской книге, часть страниц была с тонировкой, а часть нет. Так я, для не тонированных страниц, фон бумаги делал немного серым, чтобы контраст не сильно прыгал между страницами.
Наверх
« Последняя редакция: 17.06.2015 :: 09:12:34 от AlVaKo »  

Сложно отбинаризировать черную перемычку на белой бумаге, особенно если её там нет.
 
IP записан
 
AAW
Патриарх
*****
На Форуме


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5567
Екатеринбург
Пол: male
Re: Тонированная бумага
Ответ #12 - 17.06.2015 :: 09:14:22
 
AlVaKo писал(а) 17.06.2015 :: 08:42:05:
Не совсем понимаю, зачем цветную бумагу кодировать в маске.

можно пару моментов прояснить, для понимания сущности?
Всё что я читал про маску - это что она задаёт цвет блита. Ваша фраза не вписывается в моё понимание формата. Невозможно закодировать маской "не-блит".
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
AlVaKo
Гуру
****
Вне Форума



Сообщений: 576
Алма-Ата
Пол: male
Re: Тонированная бумага
Ответ #13 - 17.06.2015 :: 10:56:06
 
Вот в примере у mor 1-я страница целиком в маске. В гляделке включаем режим просмотора только фона и видим белое поле, т.к. желтизна в маске. Включим режим "черно-белый вид" увидим черное поле, маска полностью покрывает страницу.

Я не претендую на правильное и тем более полное понимание что-такое djvu, и с чем его едят. Скажу как я это понимаю. Маска это графический слой который покрывает фон/задний план. Слой  маски как правило не сплошной, а имеет вырезы/пропуски через которые виден фон. Маска может быть сжата вообще методом FaxG4 (спецификация позволяет) и не иметь набора блитов(тем более словаря символов).

Маска может иметь 3 вида отображения.
1. маска 1-бит, значения 0/1 пререключатель черная-маска/фон.
2. маска набор индексных цветов, среди которых один "прозрачный цвет" для пропуска фона.
3. похож на первый вариант. Маска 1-битная, но не черная. Цвет для окрашивается берется из дополнительного слоя "передний план".

Т.е не всегда блит маски задает цвет.

Цитата:
Невозможно закодировать маской "не-блит".

Может кодировщик, когда его заставляют всё отправить в маску, обширные области бумаги начинает дробить на мелкие квадраты, потом от них отгрызает буквы(части букв), и получает блиты для окружения черного текста.
Наверх
 

Сложно отбинаризировать черную перемычку на белой бумаге, особенно если её там нет.
 
IP записан
 
mor
Патриарх
*****
Вне Форума



Сообщений: 1769
Пол: male
Re: Тонированная бумага
Ответ #14 - 17.06.2015 :: 23:37:46
 
AlVaKo
Не могли бы вы поподробней рассказать о настройках msepdjvu для кодирования цвета страницы не в маске и не в фоне?
Залил два варианта одной страницы. В одном белый цвет заменен на желтый. Подскажите как его закодировать оптимально?
http://ovrload.ru/f/55264_0055.zip
Наверх
 
 
IP записан
 
AlVaKo
Гуру
****
Вне Форума



Сообщений: 576
Алма-Ата
Пол: male
Re: Тонированная бумага
Ответ #15 - 18.06.2015 :: 10:12:43
 
mor писал(а) 17.06.2015 :: 23:37:46:
AlVaKo
Не могли бы вы поподробней рассказать о настройках msepdjvu для кодирования цвета страницы не в маске и не в фоне?

Это, то что я назвал 3-вариантом,  вариант окрашивания 1-битной маски с использованием дополнительного слоя? На  мой взгляд, самый бестолковый вариант.
У мsepdjvu, основной режим это раздельный доступ к двум кодировщикам, отдельно для маски и отдельно для фона. И по моему, в мsepdjvu в этом режиме нельзя создать третий слой "ПП" для окрашивания маски. В documenttodjvu создаются, но чаще уродцы какие-то.
 
Посмотрите ЛС.
Наверх
 

Сложно отбинаризировать черную перемычку на белой бумаге, особенно если её там нет.
 
IP записан
 
mor
Патриарх
*****
Вне Форума



Сообщений: 1769
Пол: male
Re: Тонированная бумага
Ответ #16 - 20.06.2015 :: 21:53:19
 
Основные результатов  моих экспериментов с цветным фоном:
1. Я остановился на способе с использованием раздельного кодирования (см. выше пост nbl). Цветные подложки сделать очень быстро, да и не приходится править финальный ч/б вариант.
Для меня раздельное кодирование оказалось оптимальным, поскольку я его использую постоянно и мне проще работать с разделенным сканами.

2. AlVaKo прислал мне свою программу-оболочку для работы с msepdjvu. Большое спасибо за программу и советы по ее использованию.
Программа интересная, но результат на выходе примерно такой же. Фон создается автоматически без использования доп. файла подложки. Размеры файлов получились примерно одинаковые.
Затраты на цвет фона - 1,2кБ/стр. при ДЗФ=6, 0.5 кБ/стр. при ДЗФ=10.

Вопреки совету AlVaKo, отправил на кодирование ~900 стр. - размер временного sep-файла составил 2,7 ГБ.

На мой взгляд, использовать можно оба варианта, но программа от AlVaKo заинтересовала более гибкой настройкой msepdjvu. Я для кодирования обычно использовал старую оболочку FSD, в которой очень ограниченные настройки.

Книга,  на которой экспериментировал - http://publ.lib.ru/cgi/forum/YaBB.pl?num=1110646937/961#961-
Наверх
 
 
IP записан
 
nbl
Гуру
****
Вне Форума



Сообщений: 502
Кузбасс
Пол: male
Re: Тонированная бумага
Ответ #17 - 21.06.2015 :: 07:03:39
 
mor писал(а) 20.06.2015 :: 21:53:19:
Затраты на цвет фона - 1,2кБ/стр. при ДЗФ=6, 0.5 кБ/стр. при ДЗФ=10.

Если фон одноцветный, то настоятельно рекомендую делать ДЗФ=12. Фон будет еще меньше места в выходном файле занимать.
Наверх
 
 
IP записан
 
AlVaKo
Гуру
****
Вне Форума



Сообщений: 576
Алма-Ата
Пол: male
Re: Тонированная бумага
Ответ #18 - 21.06.2015 :: 11:17:23
 
mor писал(а) 20.06.2015 :: 21:53:19:
Размеры файлов получились примерно одинаковые.
Затраты на цвет фона - 1,2кБ/стр. при ДЗФ=6, 0.5 кБ/стр. при ДЗФ=10. 

Даже когда делитель фона =6, можно ещё уменьшить занимаемый объем.
Резко понизить качество при сжатии
Попробывал прописать строку "23+10+10", вес фона составил 0.3кБ
Наверх
 

Сложно отбинаризировать черную перемычку на белой бумаге, особенно если её там нет.
 
IP записан
 
mor
Патриарх
*****
Вне Форума



Сообщений: 1769
Пол: male
Re: Тонированная бумага
Ответ #19 - 21.06.2015 :: 15:29:29
 
На мой взгляд, разница 0.3-1.5 кБ/стр. не является значительной. На 500-страничной книге выигрыш будет мал (500-600 кБ).

С ДЗФ=12 у меня появилась проблема - fsd отказывался его кодировать. Возможно причина этого - не кратность 12 большинства "стандартных" размеров ( http://publ.lib.ru/cgi/forum/YaBB.pl?num=1326659317 ; )
Наверх
 
 
IP записан
 
AlVaKo
Гуру
****
Вне Форума



Сообщений: 576
Алма-Ата
Пол: male
Re: Тонированная бумага
Ответ #20 - 21.06.2015 :: 15:56:23
 
У msepdjvu в описании сказано, что максимально возможное значение делителя =6.
Целочисленная кратность размеров(в пикселах) страниц делителю желательна. А у первых версий моей оболочки была обязательна, сейчас уже нет. Как там  у fsd, не знаю.
Наверх
 

Сложно отбинаризировать черную перемычку на белой бумаге, особенно если её там нет.
 
IP записан
 
nbl
Гуру
****
Вне Форума



Сообщений: 502
Кузбасс
Пол: male
Re: Тонированная бумага
Ответ #21 - 21.06.2015 :: 15:59:29
 
mor писал(а) 21.06.2015 :: 15:29:29:
С ДЗФ=12 у меня появилась проблема - fsd отказывался его кодировать.

Вас спасет DjVu Imager. Там такой проблемы нет. Правда, я FSD в глаза не видел. Много раз пытался найти эту программу и все неудачно.
Наверх
 
 
IP записан
 
nbl
Гуру
****
Вне Форума



Сообщений: 502
Кузбасс
Пол: male
Re: Тонированная бумага
Ответ #22 - 21.06.2015 :: 16:02:29
 
AlVaKo писал(а) 21.06.2015 :: 15:56:23:
Целочисленная кратность размеров(в пикселах) страниц делителю желательна.

В стандарте DjVu предусмотрен случай, когда страница не кратна делителю нацело. DjVu Imager это учитывает и работает по стандарту.
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
На Форуме


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5567
Екатеринбург
Пол: male
Re: Тонированная бумага
Ответ #23 - 21.06.2015 :: 16:37:30
 
nbl писал(а) 21.06.2015 :: 15:59:29:
Правда, я FSD в глаза не видел. Много раз пытался найти эту программу и все неудачно.

с трудом, но находится: http://natafriends.org/scanbooks.html

Пожалуйста, специалисты, гляньте тему по СК с моим вопросом:
http://publ.lib.ru/cgi/forum/YaBB.pl?num=1336222925/35#35
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
nbl
Гуру
****
Вне Форума



Сообщений: 502
Кузбасс
Пол: male
Re: Тонированная бумага
Ответ #24 - 21.06.2015 :: 19:43:51
 
Скачал FSD и оказалось, что программа уже давно у меня в архиве лежит. Посмотрел на нее и понял, что я ее давно когда-то гонял и отказался от нее в пользу DjVu Imager. Чего и всем рекомендую.
Наверх
« Последняя редакция: 22.06.2015 :: 05:38:28 от nbl »  
 
IP записан
 
Переключение на Главную Страницу Страниц: 1
Послать Тему Печать