OCR форумы Добро пожаловать, Гость. Пожалуйста, выберите Вход или Регистрация
Всем привет!
Hi all!
 
  ГлавнаяСправкаПоискВходРегистрация Администратор Библиотека  
 
Страниц: 1 2 3 4
Послать Тему Печать
Создание PDF-книг (Прочитано 50023 раз)
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5551
Екатеринбург
Пол: male
Создание PDF-книг
21.09.2018 :: 13:35:11
 
Вадим так ничего и не перенёс из общей ветки.

А я таки доковырял создание слоёв без Акробата, спасибо папаВлад с рутрекера. Он там в ветке про обработку сделал сегодня подборку ответов как делать пдф, и упомянул что ирфан умеет делать прозрачный слой. "И тут мне как стало везти!" (с) Чокнутые
Имеется бесплатная для некоммерческого использования программа Pdftk Server. Интерфейс - через командную строку. Так там есть опции background и multibackground. Они накладывают страницы двух пдф попарно. Если верхний пдф был сделан с прозрачностью, то - получается. Во всяком случае, для одностраничного точно. Проблема была изготовить пдф с сохранением маски прозрачности того файла, который я через ирфан получил. Помог пакет imagemagick.
Получилось даже наложить на изготовленный пдф ещё одну картинку, повторным прогоном. Причём она была в 300dpi изготовлена, а чб текст и первая картинка были в 600dpi.
Мне кажется, что лучше делать маску прозрачности не у картинки, как я сделал, а у чб текста. А то текст становится местами полупрозрачным, если у картинки не вполне белый фон. Ирфан, видимо, создаёт 8-битную маску прозрачности.

А вот нормально сжать чб текст пока что не выходит. Втрое-четверо больше, чем дежавю, а то и вшестеро. Нужен кодер с разделяемым словарём. Не могу найти, хотя начинаю догадываться что тоже копать надо хелпы от консольных линуксовых программок. Где-нибудь затесался ключик, который делает pdf или jbig2 с многостраничностью.
Даже FreePic2Pdf от разработчика DjvuToy не помог. jbig2 в нём есть, и lossless, и lossy, но файл получается ненормально крупный.
Наверх
« Последняя редакция: 29.11.2022 :: 22:03:26 от Вадим »  

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5551
Екатеринбург
Пол: male
Re: Создание PDF-книг
Ответ #1 - 21.09.2018 :: 14:48:45
 
bolega писал(а) 21.09.2018 :: 14:20:53:
Вы считаете это чем-то выдающимся?

I'm sorry.
Для себя - конечно Улыбка

Upd:

bolega, вы же уважаете перфекционистский подход. Я всего лишь хочу задействовать заложенные в формате возможности. Не платя адобу или калласу сотни евриков. И обучиться, ведь ни одной книги в pdf я никогда не делал (принтер doPDF в расчёт не беру). Ну а изготовление книг через СК - безальтернативно.
Наверх
« Последняя редакция: 21.09.2018 :: 15:09:22 от AAW »  

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
xyz
Гуру
****
Вне Форума


Всем привет!

Сообщений: 893
Re: Создание PDF-книг
Ответ #2 - 21.09.2018 :: 15:34:51
 
Я думаю, болега тонко намекает, что такое наложение в СК делается.
Наверх
 
 
IP записан
 
slava_kry
Гуру
****
Вне Форума



Сообщений: 557
Re: Создание PDF-книг
Ответ #3 - 22.09.2018 :: 13:41:36
 
Круглые глаза Зная вашу дотошность - жду результатов. Улыбка
Наверх
 

Он сказал им: вы выказываете себя праведниками пред людьми, но Бог знает сердца ваши, ибо что высоко у людей, то мерзость пред Богом.
 
IP записан
 
cubonore
Новичок
*
Вне Форума


Всем привет!

Сообщений: 4
Re: Создание PDF-книг
Ответ #4 - 07.10.2018 :: 14:17:04
 
мда, есть же pdfbeads которые прекрасно собирает pdf, можно даже разобрать djvu и из этого собрать такой же pdf.
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5551
Екатеринбург
Пол: male
Re: Создание PDF-книг
Ответ #5 - 07.10.2018 :: 14:35:29
 
cubonore писал(а) 07.10.2018 :: 14:17:04:
pdfbeads

продемонстрируйте это на практике, запишите ролик. Я вот, сколько ни крутился, пока что качественно изготовить пдф не могу (все эксперименты - под виндой).
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
krestik
Гуру
****
Вне Форума


Всем привет!

Сообщений: 840
Re: Создание PDF-книг
Ответ #6 - 07.10.2018 :: 17:44:46
 
AAW писал(а) 07.10.2018 :: 14:35:29:
..., запишите ролик.


Не дождетесь  Смех Смех Смех Смех Смех Толстые книги вам в руки  Смех Смех Смех
Наверх
 
 
IP записан
 
Skay
Новичок
*
Вне Форума


Всем привет!

Сообщений: 32
Re: Создание PDF-книг
Ответ #7 - 12.11.2018 :: 11:45:56
 
@
AAW
что то он не отвечает. Тогда я продемонстрирую. Делал не я, но мне подкинули черновую версию скриптика. Автор с хабра пока что его еще доводит до ума.
Наверх
« Последняя редакция: 29.11.2022 :: 22:04:23 от Вадим »  
 
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5551
Екатеринбург
Пол: male
Re: Создание PDF-книг
Ответ #8 - 12.11.2018 :: 13:47:19
 
@ Skay
Архив с ЯД смогу скачать только вечером.
В какой операционке вы запускали pdfbeads?
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
Skay
Новичок
*
Вне Форума


Всем привет!

Сообщений: 32
Re: Создание PDF-книг
Ответ #9 - 12.11.2018 :: 14:18:47
 
@
AAW
тот скрипт который мне дали, он под линуксовый баш. Я "баловался" в виртуальной машине.
pdfbeads же написана на ruby, т.е. скриптовая, под виндой интерпритатор имеется.

Если на пальцах, DjVu пересобирается в PDF следующим образом:

нужная страница извлекается с помощью djvused командой save-page-with — чтобы получить полноценный файл (со включёнными пошаренными данными).
Затем дампом извлекается нужная информация — наличие определённых слоёв, общая информация о странице (размеры; разрешение; текстовый слой).
Если нет фронтального слоя или бэкграунда, то скармливаем  pdfbeads, который жмёт в jbig2 c пошаренным словарём на каждые 15 страниц
Если такие слои есть — они извлекаются в файлы с соответствующими суффиксами, и потом с ними «воюет» также pdfbeads.  (предварительно пережав их в jpeg2000 тем же imagemagick )
Если раскрашенная маска — формируем новый djvu, в котором выкинут фон и фронт; преобразуем в индексированный tiff или png; дальше снова работает pdfbeads.

Полностью автоматизированного варианта пока что нет. Ждем Улыбка Если pdfbeads под виндовс нормально будет работать, то сам скрипт потом подогнать будет не проблема Улыбка (хотя на 10ке под эти цели  можно просто установить линукс прямо из магазина приложений).
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5551
Екатеринбург
Пол: male
Re: Создание PDF-книг
Ответ #10 - 12.11.2018 :: 14:45:42
 
Skay писал(а) 12.11.2018 :: 14:18:47:
Если pdfbeads под виндовс нормально будет работать

об этом я и говорю. везде есть вялые упоминания, что pdfbeads под виндой не работает корректно.
Мне что, виртуалку ради конверсии ставить Очень довольный

Но я провёл очень мало экспериментов: на работе закрыт интернет, и выкачать какие-либо пакеты для юникс-машины я не могу, даже если и поставлю виртуалку. А все попытки запустить на винде ruby, imagemagick, pdfbeads  и jbig2enc с принесённых файлов, т.е. вручную, наткнулись на мой полный дилетантизм. Как слепой щенок потыкался, понял что я не соображаю вообще ничего, и временно отступился. Дома же на убунту абсолютно нет времени. Это надо дня четыре полностью выделить, по нескольку часов, а не урывки по 20 минут перед сном.

Правильно Dmitry7 написал в смежной ветке: для не-программистов плиз готовую программу.

Нужен подробный алгоритм разворачивания софта и его стыковки. Я в ветке на руборде как-то прочитал как человек мучался с компилированием STA. Ну не дело это!! Должно быть либо в виде готового пакета, либо детальнейшее описание, чтоб "гуманитарий на селе" тоже мог это сделать.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
Skay
Новичок
*
Вне Форума


Всем привет!

Сообщений: 32
Re: Создание PDF-книг
Ответ #11 - 12.11.2018 :: 15:36:39
 
@
AAW
можно дома на виртуалке все настроить, какой нибудь минимальный дистр, и взять настроеный образ с собой  Улыбка (Его можно прямо в таком виде и распространять.)
Под линукс распространение гораздо проще. Там один скрипт контейнера даешь, его запускаешь, и он выкачивает и всё складывает именно в том виде как ему кто то когда то указал. После чего можно сразу работать.

На виндовс я поковыряюсь.  Так же интересно попробовать собрать всё это добрно в, чтоб все делать прямо из виндовой консоли.

Цитата:
Я в ветке на руборде как-то прочитал как человек мучался с компилированием STA.
Компиляция порой да, ппц нетривиальная задача. Особенно когда зоопарк всего и вся используется. Начинается то всё на самом деле просто "чтоб не изобретать велосипед возьмем готовое" и потом только в ширину всё разростается.
AAW писал(а) 12.11.2018 :: 14:45:42:
"гуманитарий на селе" тоже мог это сделать.

гуманитарий гуманитарию рознь. Увы. Плюс в PDF Не обязательно перегонять именно тому же человеку что и DjVu делает. Гуманитарий по прежнему может клепать DjVu, а если будет автоматизированный скрипт, там можно чтоб хоть сервер поднять хД.
Поживем увидим, законченой версии скрипта все равно пока что нет, есть только полуавтоматизированый.
Наверх
« Последняя редакция: 29.11.2022 :: 22:05:12 от Вадим »  
 
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5551
Екатеринбург
Пол: male
Re: Создание PDF-книг
Ответ #12 - 12.11.2018 :: 18:07:55
 
Skay писал(а) 12.11.2018 :: 15:36:39:
можно дома на виртуалке все настроить, какой нибудь минимальный дистр

Именно эта мысль пришла и мне в голову.Работающий "дистрибутив", к которому после развертывания можно подцепить внешний ресурс с djvu.
Но дома у меня времени на это нет. тупик.
Ну, наверное, можно притащить на работу свой ноут... и по gsm-модему... долго только обучаться всему этому. Правда, кусок для Хрестоматии для xyz (про визард дежавю) я закончил, чуть освободилось время. Два месяца с лишним ушло.
А может, вы и сделаете такой дистрибутив? Если разбираетесь.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
Skay
Новичок
*
Вне Форума


Всем привет!

Сообщений: 32
Re: Создание PDF-книг
Ответ #13 - 12.11.2018 :: 19:06:10
 
@
AAW
ну я не сильно разбираюсь, но данный скрипт заставлял работать. поищу дистрибутив поменьше чтоб не так много качать/носить, попробуем заставить работать Улыбка а то сейчас физически проблематично залить 20Гб куда либо))
Наверх
 
 
IP записан
 
Skay
Новичок
*
Вне Форума


Всем привет!

Сообщений: 32
Re: Создание PDF-книг
Ответ #14 - 16.11.2018 :: 17:37:52
 
@
AAW

Нашел видео, где показано в сочетании каких версий программ надо ставить, чтоб заработал pdfbeads - тут пошаговая инструкция. (проверил на работе, работает)
Тут сохраненые дистрибутивы/архивы программ


Тут добавил папку с распакованым PDF. После установки руби и остальных программ, открываем папку в консоли, и набираем  pdfbeads -x8 > out.pdf и он соберет всё в PDF. (цифра 8 - максимальное количество встречаемых уникальных цветов - актуально для переднего слоя, бэкграунд потом подклеивается как есть, т.е. в моем случае он опжат в jp2, можно с нужным качеством пожать)
текстовый слой пока удалил, потому что в самом pdfbeadsгде то не верно отрабатывает тег, и падает. Надо потом найти попраивть.
Наверх
« Последняя редакция: 29.11.2022 :: 22:06:43 от Вадим »  
 
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5551
Екатеринбург
Пол: male
Re: Создание PDF-книг
Ответ #15 - 16.11.2018 :: 17:42:46
 
@ Skay
Thanks! Обязательно попробую.
Это для win10? ролик в имени её называет.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
Skay
Новичок
*
Вне Форума


Всем привет!

Сообщений: 32
Re: Создание PDF-книг
Ответ #16 - 16.11.2018 :: 21:59:53
 
@
AAW
там на примере 10ки, но я смотрел и повторял все - там это не важно. Главное соответствующие версии софта.
Для пережатия бэкграундов в jp2, надо будет поискать версию imagemagick с поддержкой Jpeg2000, а то для прмиера я сейчас руками в фотошопе делал. А так можно будет одной командой через консоль подготовить.

И да, pdfbeads  весь "мусор" который создается в процессе работы, оставляет в папке с исходниками (наврено можно чтоб не делала, но надо разбираться). Из этого примерно видно алгоритм работы (хотя код открыт можно и так всё посмотерть). Она малоцветные файлы - разделяет на отдельные ч/б файлы, в котором отрисовано только соответствующее данном цвету ( в названии добавляется цвет в HEX формате), а потом она уже дальше пережимает и в нужный для PDF формат.

Текстовый слой она принимает в формате hocr - можно достать например из готового djvu. Но надо либо из него вычищать теги на которых она падает (что не верно), а лучше поразбираться с кодом и поправить чтоб обрабатывала корректно.
Наверх
« Последняя редакция: 16.11.2018 :: 22:07:02 от Skay »  
 
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5551
Екатеринбург
Пол: male
Re: Создание PDF-книг
Ответ #17 - 17.11.2018 :: 15:55:22
 
@ Skay
ролик понял, уже плюс Улыбка
Попробовать ещё не попробовал.
Но ведь gem требует наличия интернета? то есть pdfbeads оттуда тягается? А хотелось в том числе и решения этой задачки. Чтоб пакеты принести на работу.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
Skay
Новичок
*
Вне Форума


Всем привет!

Сообщений: 32
Re: Создание PDF-книг
Ответ #18 - 17.11.2018 :: 17:14:43
 
@
AAW
в примере видео да, ставится все с наличием интернета, но как я видел, gem'ы руби можно выкачать как есть и устанавливать руками. Правда и все gem'ы зависимости тоже.
Вроде бы после установки gem'ов , всё находится в папке с руби, и можно копировать как есть, а на машине придется доустановить только imagemagick  и PATH прописать). Но это надо проверять.


Наверх
« Последняя редакция: 29.11.2022 :: 22:07:30 от Вадим »  
 
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5551
Екатеринбург
Пол: male
Re: Создание PDF-книг
Ответ #19 - 17.11.2018 :: 17:24:50
 
Skay писал(а) 17.11.2018 :: 17:14:43:
Вроде бы после установки gem'ов , всё находится в папке с руби, и можно копировать как есть, а на машине придется доустановить только imagemagick  и PATH прописать). Но это надо проверять.

На этом я тогда и застрял - попытался развернуть папку, а руби gem  не видел. И никакой доки что именно в настройках самого руби надо допрописать, я не обнаружил. Типа, все gemы в сети присутствуют, а больше вам ничего знать и не надо Улыбка
Совершенно верно, я хочу поставить пакеты на машине с интернетом, а потом попытаться приволочь это скопом на другую машину и запустить.
Большое спасибо за отклик.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
Skay
Новичок
*
Вне Форума


Всем привет!

Сообщений: 32
Re: Создание PDF-книг
Ответ #20 - 17.11.2018 :: 19:45:02
 
Всё необходимое для установки:
Инструкция по установке ruby 1.9.3 и сопутствующего ПО:
Спойлер:

Создаем папку "r" (для примера) на диске С, куда будем устанавливать всё необходимое ПО. Нельзя чтоб в пути были пробелы и/или русские буквы.
Открываем папку с желаемой версией и разрядностью.[/url]
Первым делом устанавливаем ruby, запустив rubyinstaller, со всеми опциями которые можно выбрать. Путь установки
Code:
C:\r\Ruby 


Если в папке имеется папка "lib", то копируем ее в "C:\r\Ruby" с заменой (сертификаты для работы с сетью)
Чтоб провериь что установилась и работает, открываем консоль, и выполняем команду
Code:
ruby -v 


Для 1.9.3 ответ будет:
Цитата:
ruby 1.9.3p551 (2014-11-13) [i386-mingw32]

Для 2.3.0 ответ будет:
Цитата:
ruby 2.3.0p0 (2015-12-25 revision 53290) [x64-mingw32]

Распаковываем DevKit из этой же папки в
Code:
C:\r\RubyDevKit 


Делаем чтоб руби видела установленый DevKit, для:
Открываем консоль, переходим в папку с DevKit (набираем команду в консоли):
Code:
cd C:\r\RubyDevKit 


и выполняем последовательно команды:
Code:
ruby dk.rb init 


Code:
ruby dk.rb install 



Установка необходимого ПО:
Спойлер:

(все необходимое находится по ссылкее в папке pdfbeads)
Устанавливаем ImageMagick, разрядность выбираем такую же как и установленная у нас ruby.
Путь для установки:
Code:
C:\r\ImageMagick 


В процессе обязательно должны быть выбраны опции
Цитата:
Add application directory to your system path
Install development headers and libraries for C and C++
Install ImageMagickObject OLE Control for VBscript, Visual Basic, and WSH

Для проверки установки, в консоли выполняем команду:
Code:
convert -version 


Ответ будет:
Цитата:
Version: ImageMagick 6.9.8-9 Q16 x64 2017-06-03
Copyright: Copyright (C) 1999-2015 ImageMagick Studio LLC
License:
Visual C++: 180040629
Features: Cipher DPC Modules OpenMP
Delegates (built-in): bzlib cairo flif freetype jng jp2 jpeg lcms lqr openexr pangocairo png ps rsvg tiff webp xml zlib

Распаковываем содержимое jbig2enc-0.28-leptonica-1.68-win32-bin.zip в папку
Code:
C:\r\Jbig2 


Чтоб энкодер был доступен из консоли, необходимо добавить его в переменную окружения.
Для этого открываем консоль и набираем команду:
Code:
setx Path "C:\r\Jbig2;%PATH%" 


Если данная команда недоступна, смотрим в гугле как это сделать.
Для проверки установки, в консоли выполняем команду:
Code:
jbig2 -V 


Ответ должен быть:
Цитата:
jbig2enc 0.28


Установка pdfbeads (без интернета):
Спойлер:

(все необходимое находится по ссылке в папке pdfbeads / gems)
В консоли, переходим в папку "!All"
чтоб установить все gem'ы из нее, набираем команду:
Code:
gem install --force --local *.gem 


Переходим в консоли на уровень вверх
Code:
cd .. 


Открываем папку соответствующую версии установленой ruby, и так же устанавливаем все gem'ы
Code:
gem install --force --local *.gem 


Возвращаемся в папку gems:
Code:
cd .. 


устанавливаем rmagick:
Code:
gem install --local rmagick-2.16.0.gem -- -- with-opt-dir-C:\r\ImageMagick\ 


Устанавливаем pdfbeads:
Code:
gem install --local pdfbeads-*.gem 



Установка pdfbeads (с интернетом):
Спойлер:

В консоли последовательно выполняем команды:
Если ruby версии 1.9.3:
Code:
gem install rmagick -- -- with-opt-dir-c:\Other\p\ImageMagick\ 


Code:
gem install nokogiri -v 1.5.10 


Code:
gem install ttfunk -v 1.4.0 


Если ruby версии 2.3.0:
Code:
gem install rmagick -- -- with-opt-dir-c:\Other\p\ImageMagick\ 


Code:
gem install nokogiri 


Устанавливаем pdfbeads:
Code:
gem install pdfbeads 


На rubygem может быть доступна не актуальная версия pdfbeads .

Исходники актуальной версии всегда можно скачать с гитхаб

Наверх
« Последняя редакция: 29.11.2022 :: 22:11:40 от Вадим »  
 
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5551
Екатеринбург
Пол: male
Re: Создание PDF-книг
Ответ #21 - 18.11.2018 :: 18:40:06
 
Skay писал(а) 17.11.2018 :: 19:45:02:
Всё. Можно пользоваться.

Дома - работает!

На вашем примере почему-то пдфка собралась вдвое меньшего размера:
что весьма и весьма странно.

Индексный примерчик (из ДЭ) тоже собрался, только он почему-то в полтора раза больше чем вариант от slava_kry, собранный ещё позавчера в ИнДезе.
70кб
42кб

Но, главное, работает. Единственное что - на WinXP команды setx нет Улыбка Ручками PATH прописал.

Я даже попробовал словарь jbig2 увеличить, тоже вроде как работает. При задании 100-страничного на 144-страничной пачке тиффов размер уменьшился от 2,8 до 2,0 Мб. (правда дежавю на этих тиффах - 1,4Мб). Наверное из-за того что jbig2 lossless.

В общем, класс!
Наверх
« Последняя редакция: 29.11.2022 :: 22:12:37 от Вадим »  

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
Skay
Новичок
*
Вне Форума


Всем привет!

Сообщений: 32
Re: Создание PDF-книг
Ответ #22 - 18.11.2018 :: 20:51:05
 
AAW писал(а) 18.11.2018 :: 18:40:06:
На вашем примере почему-то пдфка собралась вдвое меньшего размера
что весьма и весьма странно.

всё нормально. Тот что я присылал как результат, это делал не я. А в моем случае я чуть сильнее пережал в jp2 бэкграунд, основной вес от него там.
AAW писал(а) 18.11.2018 :: 18:40:06:
Индексный примерчик (из ДЭ) тоже собрался, только он почему-то в полтора раза больше чем вариант от slava_kry, собранный ещё позавчера в ИнДезе.

Вот тут я не подскажу. Все же для ИнДиза пдф родной, может заоптимизировано что то Улыбка Было бы интересно сравнить на бОльшем количестве страниц Улыбка
На работе будет время, попытаюсь поразбираться с интеграцией hocr, поищу место на котором падает.
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5551
Екатеринбург
Пол: male
Re: Создание PDF-книг
Ответ #23 - 18.11.2018 :: 21:01:17
 
AAW писал(а) 18.11.2018 :: 18:40:06:
Я даже попробовал словарь jbig2 увеличить, тоже вроде как работает.

хе-хе. с 16й по 100ю - чистые листы.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
Skay
Новичок
*
Вне Форума


Всем привет!

Сообщений: 32
Re: Создание PDF-книг
Ответ #24 - 18.11.2018 :: 21:14:22
 
AAW писал(а) 18.11.2018 :: 18:40:06:
Индексный примерчик (из ДЭ) тоже собрался, только он почему-то в полтора раза больше чем вариант от slava_kry, собранный ещё позавчера в ИнДезе.

а в каком виде были исходные файлы? в моем примере у одноцветного и малоцветного - разные форматы. tiff - ч/б, малоцветный - в индексированный tiff/png.
а то он мог tiff как есть в контейнер засунуть. при открытии как разх из ИнДиз видно как поцветно прогружается, а из pdfbeads - разом все. Отсюда может и разница в весе.
Наверх
« Последняя редакция: 18.11.2018 :: 21:33:40 от Skay »  
 
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5551
Екатеринбург
Пол: male
Re: Создание PDF-книг
Ответ #25 - 18.11.2018 :: 21:39:38
 
но цвета же он сляпал как вы описали - из отдельных файликов с номерами цветов.
файл
Наверх
« Последняя редакция: 29.11.2022 :: 22:13:04 от Вадим »  

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
Skay
Новичок
*
Вне Форума


Всем привет!

Сообщений: 32
Re: Создание PDF-книг
Ответ #26 - 18.11.2018 :: 22:03:10
 
@
AAW

да, предположение оказалось не верным. Результат в обоих случаях оказался одинаковый.

UPD: вроде починил поддержку hocr
Наверх
« Последняя редакция: 19.11.2018 :: 11:07:00 от Skay »  
 
IP записан
 
Skay
Новичок
*
Вне Форума


Всем привет!

Сообщений: 32
Re: Создание PDF-книг
Ответ #27 - 19.11.2018 :: 12:07:25
 
@
AAW

В файле ..\Ruby193\lib\ruby\gems\1.9.1\gems\pdfbeads-1.1.1\lib\pdfbeads\pdfbuilder.rb
надо заменить строку
Code:
c_str << getHOCRText( hocr,pheight,72.0/xres,72.0/yres,encodings ) 


на
Code:
c_str << getHOCRText( hocr,pheight,72.0/p.x_res,72.0/p.y_res,encodings ) 


К своему примеру на яд, докинул hocr-файлы выдранные из DjVu

А еще ..\Ruby193\lib\ruby\gems\1.9.1\gems\pdfbeads-1.1.1\lib\pdfbeads\pdfpage.rb
заменить
Code:
self.define( 'JP2','rate',015625 ) 


на
Code:
self.define( 'JP2','rate',0.0078125 ) 


Компрессия у бэкграунда чуть сильнее должна быть)
Наверх
« Последняя редакция: 29.11.2022 :: 22:14:04 от Вадим »  
 
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5551
Екатеринбург
Пол: male
Re: Создание PDF-книг
Ответ #28 - 19.11.2018 :: 12:16:29
 
Thanks.

На работе тоже поставилось без особых проблем, на семёрку.

Странно, но 20 и 60 чёрно-белых листов, сделанные на работе, просматриваются в акробатридере версии 9.5 нормально. То ли у меня дома акробатридер7 глючит, то ли сборка всё же зависит от операционки. Хотя дома я по умолчанию настроил просмотр на PDF-Xchange Viewer, а он казал чистые листы. И в Сети есть пара упоминаний, что после кодера jbig2 от Адама Лэнгли файлики частенько глючные выходят. В общем, рано выпускать в жизнь книги из-под pdfbeads. Надо массу тестов провести, включая огромные красочные энциклопедии. Да и методика проверки качества не просматривается. Но сам инструмент приятный - положил пачку тиффов, кнопку ткнул и подождал.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
Skay
Новичок
*
Вне Форума


Всем привет!

Сообщений: 32
Re: Создание PDF-книг
Ответ #29 - 19.11.2018 :: 12:27:05
 
@
AAW
от операционки там вроде зависить нечему.
AAW писал(а) 18.11.2018 :: 18:40:06:
Я даже попробовал словарь jbig2 увеличить, тоже вроде как работает. При задании 100-страничного на 144-страничной пачке тиффов размер уменьшился от 2,8 до 2,0 Мб. (правда дежавю на этих тиффах - 1,4Мб). Наверное из-за того что jbig2 lossless.

может все же не стоит менять размер словаря?
можно  проблемный файлик вместе с исходными посмотреть? (и DjVu заодно, порпобую его разобрать и собрать потом)
Наверх
 
 
IP записан
 
Страниц: 1 2 3 4
Послать Тему Печать