OCR форумы Добро пожаловать, Гость. Пожалуйста, выберите Вход или Регистрация
Всем привет!
Hi all!
 
  ГлавнаяСправкаПоискВходРегистрация Администратор Библиотека  
 
Страниц: 1 2 3 4 
Послать Тему Печать
Создание PDF-книг (Прочитано 46583 раз)
Skay
Новичок
*
Вне Форума


Всем привет!

Сообщений: 32
Re: Создание PDF-книг
Ответ #60 - 21.12.2018 :: 12:56:34
 
AAW писал(а) 21.12.2018 :: 12:33:07:
Задействовал ключ --force-resolution

ну я вот собирал Свореня, обложка у меня там другого размера, ничего вроде не уплыло.
Я тоже что то такое читал, как я понял DPI важно только для энкодера, чтоб он корректнее работал с файлами. Но тоже не уверен. Еще поле для экспериментов
AAW писал(а) 21.12.2018 :: 12:33:07:
А при чтении и, главное, печати пдф что необходимо предусмотреть?

Вот тут я не знаю что с вклейками делать. Они и нумерацию страниц сбивают в т.ч. Их по идее надо бы печатать отдельно, выносить в конец, а в тексте ссылаться. Но в той же Электроника шаг за шагом, сделали так, что идет нумерация, текст на странице обрывается, продолжается на вклейке, вклейка не учитывается в нумерации, а потом нумерация продолжается. Т.е. вклейка вроде вклейка, но перемещать ее никуда нельзя.
...
Под печать такое надо готовить отдельно, полюбому Печаль
AAW писал(а) 21.12.2018 :: 12:33:07:
По вашей правке поста 21: добавьте результаты проверки правильности установки (что должен юзер увидеть по ruby -v и т.п.).

Поправил. Там так то не столько важен вариант ответа, сколько что не будет ошибки.
Наверх
 
 
IP записан
 
slava_kry
Гуру
****
Вне Форума



Сообщений: 551
Re: Создание PDF-книг
Ответ #61 - 21.12.2018 :: 14:31:19
 
Skay писал(а) 21.12.2018 :: 12:56:34:
Они и нумерацию страниц сбивают в т.ч.

Это нормально для старых книг, т.к. вкладки готовились отдельно от блока и вставлялись относительно получившейся вёрстки, потому нумерация их и пропускает.
Наверх
 

Он сказал им: вы выказываете себя праведниками пред людьми, но Бог знает сердца ваши, ибо что высоко у людей, то мерзость пред Богом.
 
IP записан
 
Skay
Новичок
*
Вне Форума


Всем привет!

Сообщений: 32
Re: Создание PDF-книг
Ответ #62 - 24.12.2018 :: 14:21:35
 
Code:
 -T, --text-pdf PDFFILE 


не переносит текстовый слой из одного файла в другой, как я думал, а использует текстовый слой из PDF во время сборки из сканов.
Т.е. кейс практически как в DjVu - распознали сканы в файнридере, сохранили в PDF. А потом при сборке сканов в pdfbeads добавляем данный параметр с названием файла.
AAW писал(а) 20.12.2018 :: 09:14:46:
Видимо, всё-таки за правило надо брать полное удаление предыдущего мусора. В папке д.б. только первичные файлы, предназначенные для сжатия.

попробуйте с ключем
Code:
 -f, --force-update       Always write subsidiary image files even if a file
                           with the same name is already found on the disk 


slava_kry писал(а) 21.12.2018 :: 14:31:19:
Это нормально для старых книг, т.к. вкладки готовились отдельно от блока и вставлялись относительно получившейся вёрстки, потому нумерация их и пропускает.

да я понимаю это, но перфекционист внутри страдает, что там есть текст относящийся к страницам, но это вклейка.
Наверх
« Последняя редакция: 24.12.2018 :: 14:44:27 от Skay »  
 
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5431
Екатеринбург
Пол: male
Re: Создание PDF-книг
Ответ #63 - 29.12.2018 :: 19:08:04
 
Понял я сегодня, как совместить фичи СК с JBIG2. Даже не танцы с бубном, а вчистую извращение, но работает, собрал так пдфку в обед.
Надо при генерации pdf заменить страницы с чб текстом на чистые. Тогда СК всё аккуратно сожмёт, как ему указано. А чб странички пропустить через pdfbeads. Затем сложить два файла, пустив чб текст поверху, он с прозрачностью из pdfbeads выходит.
Если малоцветка есть - её надо слить с текстом, а зоны в out-задании заблокировать. Это не проверял, но должно сработать. Сегодня тестил новый СК, пришлось по-полной заюзать свойство Group зон, чтобы им настройки размножать. Это можно и при слиянии применить.
Изврат, ручной внимательный труд, зато полноцветные картинки на одной странице можно  индивидуально жать так, как требуется.
Вроде всё, теоретически задачу изготовления pdf бесплатными прогами я решил, спасибо bolega и Skay за программы. Осталось тестить.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
Skay
Новичок
*
Вне Форума


Всем привет!

Сообщений: 32
Re: Создание PDF-книг
Ответ #64 - 30.12.2018 :: 22:15:59
 
@
AAW
А можно чуть подробностей про весь кейс использования. Что именно жать СК пришлось?
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5431
Екатеринбург
Пол: male
Re: Создание PDF-книг
Ответ #65 - 31.12.2018 :: 05:14:09
 
Skay писал(а) 30.12.2018 :: 22:15:59:
Что именно жать СК пришлось?

Картинки.
Представьте, что у вас на одной странице имеется пяток картинок, которые надо пожать с разным качеством (компрессией). В pdfbeads такое в принципе сделать нельзя, он исходит из заднего слоя djvu, который "одна штука". В этом слое при изготовлении djvu придётся выбирать компрессию согласно сохранности всех картинок, то есть сжатие будет не вполне оптимальным. А в pdf объектов на странице может быть и много, каждый со своими параметрами. Получается, СК я тут задействовал как примитивный ИнДизайн, верстальную программу. В нём ведь всё уже готово, объекты размечены, расставлены.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
bolega
Патриарх
*****
Вне Форума



Сообщений: 1104
Re: Создание PDF-книг
Ответ #66 - 31.12.2018 :: 09:25:59
 
А в составе pdfbeads есть кодировщик jbig2 отдельным exe ? Или он юзает непосредственно код кодировщика из лептоники?
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5431
Екатеринбург
Пол: male
Re: Создание PDF-книг
Ответ #67 - 31.12.2018 :: 13:22:52
 
я не спец, по-моему, кодировщик (экзешник) из папки "jbig2" вызывается через imagemagick, а тот уже - из pdfbeads.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5431
Екатеринбург
Пол: male
Re: Создание PDF-книг
Ответ #68 - 05.01.2019 :: 15:56:30
 
Попробовал на практике свои соображения насчёт "скрещивания ежа с ужом".
Обдумав как и что, решил себе ещё жизнь упростить: в СК можно при создании суб-таска указать чтоб вместо выходных файлов выдавались пустые листки того же размера. И всплыл минимум один подводный камень: обложки вышли чистыми белыми, но с цветностью 8бит. И pdfbeads логично стал их преобразовывать в jp2 и делать пару с ".bg.". Соответственно, этот белый листок, его передняя часть, с суффиксом "black", перекрыл обложку из background-слоя. А скорее это задняя часть перекрыла. Пришлось вручную ирфаном понизить цветовое пространство до битмапа, TIFF Fax G4.
В остальном работает, как предполагалось. Изготовил два субтаска, в одном, полноценном, малоцветные зоны слил с текстом и отдал текст в pdfbeads, а во второй ветке с чистыми страницами восстановил обложки из оригинальной папки, заблокировал малоцветку и изготовил задник для pdf (фотки СК выдал в субтаск без изменений). Почти нет ручной работы по изготовлению чистых листков нужного формата. Во всяком случае, для простой книги (Ширяев, Грозненская область).
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
Skay
Новичок
*
Вне Форума


Всем привет!

Сообщений: 32
Re: Создание PDF-книг
Ответ #69 - 14.01.2019 :: 12:25:28
 
bolega писал(а) 31.12.2018 :: 09:25:59:
А в составе pdfbeads есть кодировщик jbig2 отдельным exe ? Или он юзает непосредственно код кодировщика из лептоники?

pdfbeads в себе не содержит, отдельно прописываем в переменных средах путь до эксешника jbig2. на линухе ставится лептоника.
AAW писал(а) 31.12.2018 :: 13:22:52:
я не спец, по-моему, кодировщик (экзешник) из папки "jbig2" вызывается через imagemagick, а тот уже - из pdfbeads.

Не, pdfbeads напрямую работает именно с jbig2, а вот к imagemagick ребование чтоб был с поддержкой jpeg2000
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5431
Екатеринбург
Пол: male
Re: Создание PDF-книг
Ответ #70 - 16.04.2019 :: 16:43:21
 
Ма Цзян по моей просьбе изменил работу djvutoy с малоцветкой при конверсии djvu в pdf. Вот софт, на тесты:
https://drive.google.com/open?id=1AZL07mOEwAhiSo8sP2HW6a_2aFKf9CWB
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
Skay
Новичок
*
Вне Форума


Всем привет!

Сообщений: 32
Re: Создание PDF-книг
Ответ #71 - 19.04.2019 :: 23:50:58
 
@
AAW
прогнал самое сложное что у меня было - всё тот же экземпляр Свореня. Результат выше всех похвал.
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5431
Екатеринбург
Пол: male
Re: Создание PDF-книг
Ответ #72 - 20.04.2019 :: 07:34:26
 
Skay
благодаря вашим усилиям по внедрению ruby Улыбка
идея-то хорошая, но разработчик с января не въезжал в тему. уж потом, в марте, взял примеры для разработки.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5431
Екатеринбург
Пол: male
Re: Создание PDF-книг
Ответ #73 - 11.06.2019 :: 05:25:51
 
от Ма Цзяна более свежая версия DjvuToy пришла в мае. только сейчас добрался выложить.
https://drive.google.com/open?id=1efCwpGYxhmHDDHxB3pH2IKo7MItAAsB1
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
waleriy
Активист
***
Вне Форума


Всем привет!

Сообщений: 490
Москва
Пол: male
Re: Создание PDF-книг
Ответ #74 - 11.06.2019 :: 18:32:13
 
AAW писал(а) 11.06.2019 :: 05:25:51:
от Ма Цзяна более свежая версия DjvuToy пришла в мае. только сейчас добрался выложить.
https://drive.google.com/open?id=1efCwpGYxhmHDDHxB3pH2IKo7MItAAsB1

Спасибо! Работает! Буд Очень довольныйем разбираться с настройками.
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5431
Екатеринбург
Пол: male
Re: Создание PDF-книг
Ответ #75 - 11.04.2020 :: 17:07:25
 
djvutoy версии 3.02 вышел.
http://www.mediafire.com/folder/f0z2hexqdnr9a/Software
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
Dmitry7
Модератор
*****
На Форуме


Соберем Серии "НВЖНиТ"!

Сообщений: 5871
Санкт-Петербург
Пол: male
Re: Создание PDF-книг
Ответ #76 - 12.04.2020 :: 15:15:39
 
AAW писал(а) 11.04.2020 :: 17:07:25:
djvutoy версии 3.02 вышел.
http://www.mediafire.com/folder/f0z2hexqdnr9a/Software

а что такое MODI  ?
Наверх
 

"Если хочешь сделать что-то хорошо, сделай это сам!"
332371574  
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5431
Екатеринбург
Пол: male
Re: Создание PDF-книг
Ответ #77 - 12.04.2020 :: 15:31:21
 
Dmitry7 писал(а) 12.04.2020 :: 15:15:39:
а что такое MODI  ?

Microsoft Office Document Imaging
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
Dmitry7
Модератор
*****
На Форуме


Соберем Серии "НВЖНиТ"!

Сообщений: 5871
Санкт-Петербург
Пол: male
Re: Создание PDF-книг
Ответ #78 - 12.04.2020 :: 15:37:14
 
AAW писал(а) 12.04.2020 :: 15:31:21:
Microsoft Office Document Imaging


спасибо!
первый раз слышу, почитаю, что это такое
Наверх
 

"Если хочешь сделать что-то хорошо, сделай это сам!"
332371574  
IP записан
 
mais
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 62
Пермь
Пол: male
Re: Создание PDF-книг
Ответ #79 - 22.05.2020 :: 22:23:04
 
Для создания книг в формате pdf я пробовал использовать программу DjVuToy: конвертировал в этой программе файлы в формате djvu c OCR-слоем. И заметил, что DjVuToy не переносит из тестового слоя файла djvu в тестовый слой pdf символ длинного тире - после копирования в файле pdf фрагмента текста, содержащего длинное тире, и последующей его вставки в Блокнот или Word, вместо длинного тире отображается символ знака вопроса. Причём при копировании этого же фрагмента текста в исходном файле djvu и его вставке в текстовый редактор длинное тире отображается правильно.
Уважаемый AAW, насколько я понял вы контактируете с создателем DjVuToy, так может быть озвучите ему эту проблемку. Не то чтобы это критичный недостаток, но другие-то символы DjVuToy в pdf переносит: и кавычки, и дефис, и восклицательный знак, и, кстати, вопросительный знак.
Использовал я DjVuToy версии 3.02, галочку в чекбоксе "OCR if no text" не ставил.  Распознавание текста проводил в FineReader, текстовый слой в djvu вставлял программой DjvuOCR.
Наверх
« Последняя редакция: 22.05.2020 :: 22:37:02 от mais »  
 
IP записан
 
Dmitry7
Модератор
*****
На Форуме


Соберем Серии "НВЖНиТ"!

Сообщений: 5871
Санкт-Петербург
Пол: male
Re: Создание PDF-книг
Ответ #80 - 22.05.2020 :: 23:12:50
 
mais писал(а) 22.05.2020 :: 22:23:04:
Распознавание текста проводил в FineReader, текстовый слой в djvu вставлял программой DjvuOCR.

какую версию FR использовали?
Наверх
 

"Если хочешь сделать что-то хорошо, сделай это сам!"
332371574  
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5431
Екатеринбург
Пол: male
Re: Создание PDF-книг
Ответ #81 - 23.05.2020 :: 05:12:07
 
mais писал(а) 22.05.2020 :: 22:23:04:
Использовал я DjVuToy версии 3.02

примеры подберите. и скриншоты. мой английский далее "hello" и "sorry" недалеко ушёл Улыбка
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
Владислав_72
Активист
***
Вне Форума



Сообщений: 337
Москва
Пол: male
Re: Создание PDF-книг
Ответ #82 - 23.05.2020 :: 12:12:41
 
mais писал(а) 22.05.2020 :: 22:23:04:
И заметил, что DjVuToy не переносит из тестового слоя файла djvu в тестовый слой pdf символ длинного тире
но другие-то символы DjVuToy в pdf переносит: и кавычки, и дефис, и восклицательный знак, и, кстати, вопросительный знак.
Так тут все просто, вышеперечисленные символы из стандартной таблицы знаков, а вот длинное тире - из дополнительной.
Наверх
 
 
IP записан
 
slava_kry
Гуру
****
Вне Форума



Сообщений: 551
Re: Создание PDF-книг
Ответ #83 - 23.05.2020 :: 15:05:19
 
Начав копать в сторону оптимизации ПДФ столкнулся с такой загагулиной... Все имеющиеся у меня проги дают "замусоренный" до нельзя ПДФ на битовых картинках!
Прямой импорт 139-ти битмапов в Акробат даёт ПДФ 1,6 МБ, а экспорт в ПДФ из программ - 13 МБ. Оптимизация не помогает, в Акробате тоже... ничего не помогает. Улыбка
Старых версий Акробата у меня нет, чтобы понять толи Акробат мудит, то ли на самом деле так много мусора генерируется, то ли сжимается неправильно.

https://yadi.sk/d/x9yNUCqsC3JrBw

...как бы невелика потеря, но всё же. Улыбка

Кстати, гляньте. пожалуйста, на скорость отрисовки страниц во вьюерах. Улыбка
Наверх
 

Он сказал им: вы выказываете себя праведниками пред людьми, но Бог знает сердца ваши, ибо что высоко у людей, то мерзость пред Богом.
 
IP записан
 
Владислав_72
Активист
***
Вне Форума



Сообщений: 337
Москва
Пол: male
Re: Создание PDF-книг
Ответ #84 - 23.05.2020 :: 20:57:57
 
slava_kry писал(а) 23.05.2020 :: 15:05:19:
Старых версий Акробата у меня нет, чтобы понять толи Акробат мудит, то ли на самом деле так много мусора генерируется, то ли сжимается неправильно.
У меня есть почти все версии от 11 и ниже.
Наверх
 
 
IP записан
 
slava_kry
Гуру
****
Вне Форума



Сообщений: 551
Re: Создание PDF-книг
Ответ #85 - 23.05.2020 :: 21:30:49
 
@
Владислав_72
Можете с 8-ой по 10-ю выложить на ЯДиск или куда ещё?
Буду через виртуалку пробовать.
Наверх
 

Он сказал им: вы выказываете себя праведниками пред людьми, но Бог знает сердца ваши, ибо что высоко у людей, то мерзость пред Богом.
 
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5431
Екатеринбург
Пол: male
Re: Создание PDF-книг
Ответ #86 - 24.05.2020 :: 07:52:48
 
slava_kry писал(а) 23.05.2020 :: 15:05:19:
скорость отрисовки страниц во вьюерах

отрисовывается быстро.

Я не спец в потрохах пдф. Взял восьмую страничку: для версии 1,6Мб изображение 28й объект, вот параметры, найдены тупо просмотром через lister тоталкоммандера:

28 0 obj
<</BitsPerComponent 1/ColorSpace/DeviceGray/Filter/JBIG2Decode/Height 6567/Length 9986

а для версии 13Мб это же изображение - объект 573, и вот что пишет:

573 0 obj
<</BitsPerComponent 1/Decode[0.0 1.0]/DecodeParms<</Columns 4913/K -1/Rows 6567>>/Filter/CCITTFaxDecode/Height 6567/ImageMask true/Intent/RelativeColorimetric/Length 110691
xchange editor пишет что для здорового файла это - "маска". а для маленького - это "изображение".
Ну и length сразу видно, 9к или 110к. кодирование тоже разное.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
Владислав_72
Активист
***
Вне Форума



Сообщений: 337
Москва
Пол: male
Re: Создание PDF-книг
Ответ #87 - 24.05.2020 :: 09:37:08
 
slava_kry писал(а) 23.05.2020 :: 21:30:49:
[color=#0033cc]
Можете с 8-ой по 10-ю выложить на ЯДиск или куда ещё?
Вам какие версии, портабл (без установки) или установочные (есть образы полных дисков, а есть unattended)?
Наверх
 
 
IP записан
 
slava_kry
Гуру
****
Вне Форума



Сообщений: 551
Re: Создание PDF-книг
Ответ #88 - 24.05.2020 :: 12:43:20
 
@
Владислав_72
Давайте без установки. Спасибо!

@
AAW
Да, данные ПитСтопа меня этим именно и смущали, что на битмапах выдавали их как "Маска" и как "RGB|CMYK"
Тогда получается, что цветокоррекция не отключается и все изображения кодируются как "маски" из всех доступных программ всёрстки.

А по второму заголовку (CCITTFaxDecode) ещё и выясняется, что Акробат их не перекодирует после "оптимизации"... Или я тут чего-то не так сделал.

Понял, ладно.
Спасибо!
Наверх
 

Он сказал им: вы выказываете себя праведниками пред людьми, но Бог знает сердца ваши, ибо что высоко у людей, то мерзость пред Богом.
 
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5431
Екатеринбург
Пол: male
Re: Создание PDF-книг
Ответ #89 - 24.05.2020 :: 14:08:18
 
Месяца полтора назад я немножко почитал про структуру pdf. Пара толковых ссылок:
Очерк по поводу создания PDF-файлов
Максим Фокин
http://citforum.ru/programming/digest/pdf_inside/

mini pdf FAQ
http://zavelos.ru/forum/13400-Kto-razbiraetsya-vo-vnutrennostyah-PDF-podskazhite

Ибо в официальном документе от адоба просто утонуть можно. А тут наглядненько.

Кстати, когда поток (stream) компрессирован Flate, разжать его помогает утилитка offzip.exe
https://zenhax.com/viewtopic.php?t=5
http://aluigi.altervista.org/mytoolz.htm#offzip
Через Flate обычно сжаты потоки команд (текст, графические примитивы pdf), а конкретно мне понадобилось увидеть перекодировочную таблицу шрифта, чтобы кракозябры исправить. Не шибко удобно пользоваться, это да. Зато контроль формата есть - если stream скопирован в бинарный входной файл неверно, то offzip ругнется.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
Страниц: 1 2 3 4 
Послать Тему Печать