Цитата:Считаю, что каждая страница электронной копии должна адекватно представлять оригинал
Вот этой фразой далее я буду придираться к твоим словам...
Цитата:{ Цитата Вадима: А то что программа неверно отображает страницы, так это вина программиста, пусть свою кривую программу дорабатывает. }
Вот тут я согласен - в просмотрщиках джву должно быть много разных опций для удовлетворения разных взглядов на то, как должно быть. Но это будет только тогда, когда программист выйдет в народ...
Цитата:Относительно нумерации страниц
Цитата:Во всей радиотехнической литературе (DJVU в смысле) уж вроде стандарт: сохранение нумерации страниц, все ненумерованное и обложку - в конец.
Цитата:Считаю, что каждая страница электронной копии должна адекватно представлять оригинал
Оригинал начинается с обложки! И "ненумерованные" в книге не в конце!
Пустые страницы из середины я не удаляю, т.к. потеряется логика при пересчете номера страницы, когда в просмотрщиках сделают такую фичу (это мечты
).
Я формирую джву таким образом, чтобы парные страницы (например схемы на разворотах) попали на экран при просмотре двойных страниц, когда в просмотрщиках сделают такую фичу (это мечты
).
Джву в виде разворотов никогда не буду делать - это нечитабельно (неуправляемо) на экране.
Есть книги, где нумерация идет с учетом обложки. Если делать как "уж вроде стандарт", то разные книги будут по разному выглядеть.
Цитата:Это для распечатки на принтере нужно
Я стараюсь делать джву для удобного просмотра на экране компа.
А при печати можно указывать страницы через зпт...
Цитата:И при распечатке с такими плавающими полями получается точная копия оригинала, а с ровными - как односторонний вордовский реферат студента первого курса.
Я стараюсь делать джву для удобного просмотра на экране компа. И поля я немалые делаю.
Плавающие поля на экране не смотрятся!
Те же доп.поля для сшивания можно указать в ФайнПринте.
Цитата:{ Цитата Zmiy: Не пятнисто, а размыто. И это не связано с "хотя бы одной полутоновой". }
Связано.
Не связано!
(Прим. - бакграунд=background=фон, фореграунд=foreground=передний план)
Сжатие каждой страницы производится независимо от других страниц. Определятся что пойдет в бакграунд, а что в фореграунд для использования при сжатии более потерьного алгоритма и менее потерьного. В джву есть словарь, но он формируется для попавших в фореграунд(!!!) фрагментов разных страниц. Для бакграунда нету словаря. А это самое размытие получается для бакграунда, т.е. для того, что сжимается другими сильными и более потерьными алгоритмами.
И раз у меня все страницы сжимались в сканед, то и получалось иногда размытие...
Цитата:{ Цитата Zmiy: Я об этих размытиях знаю, они и в пред.выпусках были, но мне не хочется делать в bitonal, боюсь он попортит своей бинаризацией гладкость букв. Нужно экпериментировать... }
Не попортит
Цитата:Если все бинарные сложить в Solo и сохранить как bitonal, а потом добавить туда полутоновые и цвет и снова сохранить как scanned, то все бинарные ГАРАНТИРОВАНО остаются однослойными. DEE всегда корректно сохраняет и те и другие,
Поэкспериментировал на ВПР74... См. ниже последовательность операций. Вроде не портит...
Но сразу встает вопрос: пусть есть книга 10 стр. битонал, 10 стр. сканед, 10 стр. битонал. У каждого куска сформируется при сжатии свой словарь фореграунда. Так вот вопрос - а при объединении 10b+10s+10b что станет с общим словарем? Я так думаю, что общего не будет... Это повлияет на размер файла.
Ну и еще вопрос остается: если на странице есть ч/б и полутон, то выбирать нужно сжатие сканед; так вот нельзя по-моему указать кодировщику какую чать страницы как обрабатывать. См. например ВПР74 и ВПР75 первую обложку, включи отображать бакграунд и увидишь, что туда попало...
Цитата:На 300 dpi все это лучше, конечно, в DEE.
После увиденного на чужих сканах, что делается в 300 с искажением букв, меня не тянет делать что-то в 300. Только если большое, да и то с обязательным включением режима lossless.
Цитата:Но там проблема: если все страницы 600dpi, он произвольно меняет разрешение некоторых (какие на 300, какие на какой-то нездоровый 1521 или около того dpi) с соответствующим изменением масштаба.
Эта проблема решается включением в профиль scan600 и bitonal600 опции --dpi=600. По умолчанию стоит --dpi=0, т.е. тот выберется тот dpi, что указан в графическом файле. А графические редакторы туда могут насовать что угодно...
Цитата:Со скриптами твоими (еще раз спасибо - я думал там что стандартное) у меня тоже чего-то пока не идет, но это я только попробовал.
Забудь про те скрипты!
Я почитал хелп на ПайнтШопПро(версия 10) и сделал лучший скрипт:
1. Бинаризация: Adjust - Brightness and Contrast - Threshold - 170 (подбирать экспериментально - зависит от исх. сканов)
2. Удаление мусора: Adjust - Add/Remove Noise - Median Filter - 5 (подбирать экспериментально - до сглаживания пустот в буквах типа "в")
3. Размытие: Adjust - Blur - Blur More (подбирать экспериментально - можно и просто Blur)
Таким скриптом и качество бинаризации значительно улучшилось и размер файла уменьшился. Главное правильно подобрать константы и не переусердствовать с удалением мусора. Насчет "3. Размытие" - это слегка размоет символы, таким образом сравняются похожие символы и попадут в словарь, а бинаризация в кодировщике сгладит размытие.
Ну а сжатие делал так:
1. Ч/б сжатие (кроме полутонов и цв.!): documenttodjvu.exe --profile=bitonal600 --dpi=600 --pages-per-dict=100 *.tif b.djvu
2. Цв./полутон. сжатие (обложки): documenttodjvu.exe --profile=scan600 --dpi=600 1.tif a.djvu
3. Объединение: djvubundle.exe a.djvu b.djvu c.djvu d.djvu
4. Уменьшение версии: djvuversion.exe --version=20 d.djvu
Опция --pages-per-dict=100 указывает словарь в 100, а не в 10 по умолчанию - меньше размер. Для больших файлов лучше большой словарь не указывать - во-первых файл будет долго открываться в просмотрщике, во-вторых при скачке фрагмента файла, его без словаря (который вроде в конце) не смогут предпосмотреть.
На этапе 2 делал сжатие по одному файлу на каждую стр. обложки - файлы a.djvu и c.djvu.
Уменьшение версии - чтобы старые просмотрщики смогли открыть djvu.
В итоге - ВПР75.