В Ваших выводах довольно много очевидных ошибок, и, учитывая нехватку времени, я не смогу их все исправить.
Цитата:В любом случае, Дежавю - не свободный формат в том смысле, что нет бесплатного софта для его производства (хотя может и написано где-то, что это "свободный формат", но без свободного софта).
DJVU - свободный формат, соответственно, есть абсолютно бесплатные утилиты для работы с ним - как кодировщики (minidjvu), так и программы просмотра (WinDjView), которые ни в чем не уступают коммерческим.
Здесь небольшое уточнение. DJVU является свободным до определенной версии (номер не помню, можно уточнить, по-моему, 22). Подробнее о версиях DJVU:
http://planetdjvu.opendoc.it/viewtopic.php?t=518После этого он был куплен сначала Lizard'ом, затем Celartem. В коммерческих версиях добавились всякие "рюшечки", вроде цветных аннотаций и DRM. Политика у новых владельцев действительно
дебильная, но для нас это не важно.
Для перевода в PDF без лицензионного софта не обойтись, как Вам известно.
Цитата:Рекомендуется tiff compressed group 4 (бинарный факсовый формат), всего то в пару раз больше , чем Дежавю, получаются файлы.
При
умелом создании DJVU - раз в двадцать!
Единственный способ значительно уменьшить объем TIFF - CPC-оптимизация. Но кодер CPC лицензионный, хотя доказать, что TIFF был оптимизирован с его помощью, сложновато. Однако даже после оптимизации такой TIFF по объему будет превышать DJVU раз в 8-16.
Т.е. оптимальный формат для организации электронной "факсимильной" библиотеки - именно DJVU. Нагрузка на сервер при его использовании (в отличие от TIFF, PDF) снизится в разы.
Далее DJVU vs PDF. Если делать факсимильную книгу в PDF и использовать G4, то это будет тот же многостраничный TIFF, просто с возможностью добавления оглавления. Объем получается совершенно неприемлемый, как ни крути. Особенно, если говорить о создании библиотеки.
Но дело в том, что и тот, и другой форматы используют родственные кодеры для сжатия графического текста. Это JBIG2 для PDF и JB2 для DJVU. Большая неприятность для Adobe состоит в том, что JBIG2
значительно проигрывает JB2 и CPC как в скорости кодирования, так и, что самое важное, в скорости декодирования. Именно поэтому графические PDF'ы с JBIG2 сжатием так тяжко читать. Более того, JBIG2-файлы (PDF) получаются, как правило, в 2-5 раз больше JB2-файлов (DJVU).
По поводу распространенности форматов. Да, Adobe именно в силу вышеобозначенных причин проводил и проводит очень агрессивную политику, в том числе и по отношению к нынешним владельцам DJVU. Поэтому Celartem, похоже, решил просто сконцентрироваться на другом рынке - азиатском, и хотя бы для начала одержать победу на своей территории.
Вот пример DJVU в моем исполнении:
http://rapidshare.com/files/46481215/Kirk_Raven_OCR_Index_TOC.djvu.html (для просмотра лучше использовать WinDjView 0.5)
В этой книге 500 страниц. Оптимизированный многостраничный CPC-TIFF для нее весит 43 Мб.
DJVU
со встроенным OCR-слоем - ~5Мб. Время обработки (ручной, без учета сканирования) - около получаса. Книга 70-го года, гибкий переплет, была в плохом состоянии. Что называется, думайте сами, решайте сами...