OCR форумы Добро пожаловать, Гость. Пожалуйста, выберите Вход или Регистрация
Форум переведен из кодировки UTF-8 в кодировку WINDOWS-1251. По всем вопросам, связанным с кодировкой текста (появлением «кракозябр»), обращайтесь к Администратору.
The forum is translated from the UTF-8 encoding to the WINDOWS-1251 encoding. For all questions related to the encoding of the text (the appearance of 'krakozyabr'), please contact the Administrator.
 
  ГлавнаяСправкаПоискВходРегистрация Администратор Библиотека  
 
Страниц: 1 ... 6 7 8 
Послать Тему Печать
Создание DJVU-книг (Прочитано 153021 раз)
Klepsidra
Новичок
*
Вне Форума


Всем привет!

Сообщений: 8
Re: Создание DJVU-книг
Ответ #210 - 28.03.2020 :: 17:16:05
 
Может кто подскажет..
Djvu.OCR.v2.4b не видит проект FineReader 14. Точнее он его видит но при тесте проекта выдает ошибку в виде отсутствия нужных файлов.

Это связано с новизной версии или я все же что-то делаю не так? Кодировала книгу раздельным способом: через Small и Imager.
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
На Форуме


Старую детскую и НП литературу
ничем не заменить

Сообщений: 4657
Екатеринбург
Пол: male
Re: Создание DJVU-книг
Ответ #211 - 03.11.2020 :: 07:05:09
 
Для тех, кто ещё пользуется Solo. Не МПФ/МРС, а автосегментирование.

Примеры профилей, которые получше, чем стандартные, разделяют текст и картинки. Прислал VadimirTT с руборды.
Он их там называет "профили от Melirius".

#@displayName:MyScanned600mod-1
MyScanned600mod-1: scan600
description=MyScanned600mod-1
pix-filter-level=0
resolution-multiplier=1
shape-filter-level=100
threshold-level=100
pages-per-dict=1000
bg-subsample=1
aggressive=true

#@displayName:MyScanned600color-1
MyScanned600color-1: scan600
description=MyScanned600color-1
pix-filter-level=0
resolution-multiplier=1
shape-filter-level=100
threshold-level=100
jb2-format=color
pages-per-dict=1000
bg-subsample=1
aggressive=true

#@displayName:MyScanned600mod-2
MyScanned600mod-2: scan600
description=MyScanned600mod-2
quality=100
bg-subsample=4
inversion-level=0
pix-filter-level=50
subsample-refine=true
shape-filter-level=100
threshold-level=20
pages-per-dict=1000
fg-quality=1
aggressive=true

Добавлять в documenttodjvu.conf
Сам я работу профилей не проверял.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
AAW
Патриарх
*****
На Форуме


Старую детскую и НП литературу
ничем не заменить

Сообщений: 4657
Екатеринбург
Пол: male
Re: Создание DJVU-книг
Ответ #212 - 22.11.2020 :: 09:29:58
 
свежий djvutoy v3.04 умеет переименовывать названия страниц. Не Title, а Name поле. На закладке Editor.
https://www.mediafire.com/folder/f0z2hexqdnr9a/Software

Также есть сырой скрипт от U235, который это проделывает в cygwin.
https://yadi.sk/d/6S9ExD8v-h0arA
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
Dmitry7
Модератор
*****
Вне Форума


Соберем Серии "НВЖНиТ"!

Сообщений: 5320
Санкт-Петербург
Пол: male
Re: Создание DJVU-книг
Ответ #213 - 27.11.2020 :: 20:14:33
 
AAW писал(а) 22.11.2020 :: 09:29:58:
свежий djvutoy v3.04



теперь и длинные тире правильно конвертируются из djvu с OCR !
Наверх
 

"Если хочешь сделать что-то хорошо, сделай это сам!"
332371574  
IP записан
 
AAW
Патриарх
*****
На Форуме


Старую детскую и НП литературу
ничем не заменить

Сообщений: 4657
Екатеринбург
Пол: male
Re: Создание DJVU-книг
Ответ #214 - 24.12.2020 :: 07:46:26
 
Переписывался тут с автором DSM, обнаружил что вышла свежая версия, ещё летом. 0.8.0.
сайт http://book-scan.wix.com/djvu#!rus/zso7s
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
AbsurdMan
Гуру
****
Вне Форума


Всем привет!

Сообщений: 830
Москва
Пол: male
Re: Создание DJVU-книг
Ответ #215 - 01.02.2021 :: 02:05:47
 
Ко мне обратились в ВК с таким вопросом

Перед вами два варианта одной и той же работы. Может быть подскажете, что надо сделать для того, чтобы она приобрела именно такой визуальный и компактный вид, как у второго варианта?
https://cloud.mail.ru/public/1SYc/FHGRgvV7s
Наверх
 
446581004  
IP записан
 
AAW
Патриарх
*****
На Форуме


Старую детскую и НП литературу
ничем не заменить

Сообщений: 4657
Екатеринбург
Пол: male
Re: Создание DJVU-книг
Ответ #216 - 01.02.2021 :: 05:22:02
 
AbsurdMan
Это подросток спрашивает? Больно наивный вопрос.
Поскольку второй вариант уже есть, то ничего делать не требуется.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
xyz
Гуру
****
Вне Форума


Всем привет!

Сообщений: 716
Re: Создание DJVU-книг
Ответ #217 - 01.02.2021 :: 06:48:38
 
AbsurdMan, а чего вы сами человеку не ответили ?

AAW,  да, блин. Я когда джву делать не умел, тоже вначале не понимал, что одна цветная, а другая ч.б.
Но тут еще надо учитывать, что исходник тут - это не скан.


Пойти на ру-борд в ветку  "Электронные книги: сканирование, обработка, сборка"
http://forum.ru-board.com/topic.cgi?forum=93&topic=3514&start=3240
и заставить себя прочитать инструкции, размещенные в её шапке.
Другого пути нет. Увы.       (Хотя шапку там, конечно, переделать надо. Может, займусь, когда время будет.)


Заметим, что одна джву - это ч.б высотой 3600 пикс, другая цветная 1800. (В "официальном" просмотрщике   Djvu Browser    ПКМ - > Help -> Page Information   или из меню   Help -> Page Information   )
Причем у ч.б перемычки побились, так что она не образец.

1. Цветную надо увеличить апскейлом раз в 6.  (В ScanKromsator заставить считать исходник 100 дпи, а вывод сделать 600 дпи).
Примечание:  Это если есть надерганные откуда-то картинки. Если картинок нет, то толстую джву надо на картинки разобрать. Например, импортировать в СК, подключив к нему DjvuLibre. Или непосредственно утилитой djvudecode   из  DjvuLibre. Или при помощи DSM, там она тоже внутри имеется.)

2. Потом через   ST-Universal(с откл в настройках сглаживанием ч.б !!) прогнать, чтобы бинаризовать. Вывод считать 600 дпи.

3. Потом уменьшить раза в два до высоты в 5400  (можно и в три до высоты в 3600).  В СК заставить считать исходник 1200 дпи, а вывод сделать 600   (или  400 дпи,  но это если размер будет толстый).
Примечание. В последних форках СТ из-за модификаций в линуксовой граф.библиотеке слетел вывод тиффов.
Вроде, последний СК должен их цеплять. Но если при импорте в СК или запихивании в джву картинка рябит, то предварительно в XnView переконвертировать СТУ-вывод в корректные несжатые ч.б тиффы.

4. А потом уже собирать джву.  При помощи  Document Express Enterprise 5.1.0   или   DjVu Small Mod   (aka DSM).

Инструкция к СК -  Хрестоматия.  (Но тут будет надо всего три действия: 1 - четвертой маркировочной кнопкой сбросить настройки; 2 - задать дпи входа/выхода на закладке Files   3 - нажать кнопку Process.  Так что можно и без нёе.)

Инструкция к СТ -   русская версия СТ-Вики тут

Почитать про использование  Document Express Enterprise 5.1.0  - моя статья в шапке ру-борда.     Сама прога есть на рутрекере. Но тут должно быть без изысков. Так для DEE - Workflow Manager  снова всего три действия  (1 - на закладке Input выбрать файлы; 2 - на закладке Output вместо  «each file» выбрать «One document only»; 3 - запустить процесс галочкой «Enable» слева.   Инструкция к  DjVu Small Mod идёт  в комплекте (файлик chm).
Наверх
« Последняя редакция: 01.02.2021 :: 07:15:37 от xyz »  
 
IP записан
 
AAW
Патриарх
*****
На Форуме


Старую детскую и НП литературу
ничем не заменить

Сообщений: 4657
Екатеринбург
Пол: male
Re: Создание DJVU-книг
Ответ #218 - 01.02.2021 :: 08:11:35
 
Ну то есть сходи пару месяцев почитай книжки/статьи Улыбка

А вот что прикольно, так это что я не сумел подобрать совет, ЧЕМ красиво отбинаризовать буквы. Только СК знаю. Ну, понимаю что и в ST можно. Но чтобы в "один щелчок пальцев" - КАК??
Вот пример, экспорт, апскейл и канал черного с коррекцией гаммы, всё в графредакторах простыми операциями:
https://yadi.sk/i/x365xjML1p-Q1Q
а дальше - ?
Ну, можно и такое обратно загнать в photo-djvu Улыбка только размер плох.
https://yadi.sk/d/KC6MA3wLgA5TWw
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
xyz
Гуру
****
Вне Форума


Всем привет!

Сообщений: 716
Re: Создание DJVU-книг
Ответ #219 - 01.02.2021 :: 08:54:42
 
Цитата:
Ну то есть сходи пару месяцев почитай книжки/статьи


Помимо общего совета я и рецепт улучшайзинга дал.

Для данного конкретного случая, как я написал - три действия в СК, три действия в DEE  (даже если статьи не читать, то в моём посте они перечислены. Пост то можно осилить прочитать ?). А СТ считается интуитивно понятным, да и инструкция к нему есть, если знать, где искать. (Тоже положил).


Цитата:
Вот пример, экспорт, апскейл и канал черного с коррекцией гаммы, всё в графредакторах простыми операциями:

Если это из рассматриваемого джву выдрано, то я вижу тут апскейл в 2 раза, а не в 6, как я советовал.


А чтобы вообще научиться книжки с красивыми буквами делать, то надо учиться. По щелчку пальцев их не будет.
Но поскольку исходник тут не скан, то красивых букв не будет, как ни крути.
Так что можно и в СТ бинаризовать. (Так как в СТ не глобальный порог, а адаптивная бинаризация, то это даже будет работать на спасение перемычек.)


Цитата:
в "один щелчок пальцев"


https://www.youtube.com/watch?v=EYWj_FEejAU
Наверх
« Последняя редакция: 01.02.2021 :: 09:03:49 от xyz »  
 
IP записан
 
AAW
Патриарх
*****
На Форуме


Старую детскую и НП литературу
ничем не заменить

Сообщений: 4657
Екатеринбург
Пол: male
Re: Создание DJVU-книг
Ответ #220 - 01.02.2021 :: 10:12:40
 
xyz писал(а) 01.02.2021 :: 08:54:42:
то красивых букв не будет, как ни крути

Помимо собственно вопроса от AbsurdMan
Поприкалывался я с бледными перемычками на своем вышеприведённом примере. В ирфанвью сделал подмену самых бледных пикселей с небольшим разбросом (tolerance). И раза четыре уровень этого серого поменял немножко. Потом попробовал бинаризовать в СК - и на удивление результат получился куда лучше, чем если прямо в СК этот пример загонять.
Так что на заметку рецептик тоже можно взять. Для вот таких дебильных случаев. Правда, не представляю, как это можно автоматизировать, кроме как в фотошопе.
То есть картинка при подмене была вот такой:
...
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
xyz
Гуру
****
Вне Форума


Всем привет!

Сообщений: 716
Re: Создание DJVU-книг
Ответ #221 - 01.02.2021 :: 10:39:19
 
Кстати да.

СК из проапсемпленного исходника с включенным аншарпом и порогом 160 буквы красивее дает

https://yadi.sk/d/TJ6R10wdekwSBg


но там видимо надо задавать порог авто для проекта.
и потом еще смотреть, какова величина коррекции этого авто будет.
Наверх
 
 
IP записан
 
Владислав_72
Активист
***
Вне Форума



Сообщений: 319
Москва
Пол: male
Re: Создание DJVU-книг
Ответ #222 - 01.02.2021 :: 10:49:40
 
xyz писал(а) 01.02.2021 :: 08:54:42:
А чтобы вообще научиться книжки с красивыми буквами делать, то надо учиться. По щелчку пальцев их не будет.
А могли бы быть и "по щелчку". Это и есть самая основная проблема Free-софта.
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
На Форуме


Старую детскую и НП литературу
ничем не заменить

Сообщений: 4657
Екатеринбург
Пол: male
Re: Создание DJVU-книг
Ответ #223 - 01.02.2021 :: 10:52:09
 
Владислав_72
Улыбка ну покажите коммерческий софт в помощь вопрошающему
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
altruist
Активист
***
Вне Форума


Всем привет!

Сообщений: 305
Russia.Penza
Пол: male
Re: Создание DJVU-книг
Ответ #224 - 01.02.2021 :: 10:58:37
 
AAW писал(а) 01.02.2021 :: 08:11:35:
Ну то есть сходи пару месяцев почитай книжки/статьи

С таким качеством как в приведённом примере STU делает их элементарно. Порог побольше делаете  https://cloud.mail.ru/public/Gp8G/cNJw2TCrg
Наверх
 

Хорошая вещь компьютер...Посидел пять минут-полтора часа прошло....
 
IP записан
 
AlVaKo
Активист
***
Вне Форума



Сообщений: 281
Алма-Ата
Пол: male
Re: Создание DJVU-книг
Ответ #225 - 01.02.2021 :: 11:20:29
 
xyz писал(а) 01.02.2021 :: 08:54:42:
Так что можно и в СТ бинаризовать. (Так как в СТ не глобальный порог, а адаптивная бинаризация, то это даже будет работать на спасение перемычек.)


Если в СТ применяется метод "Отцу", то это как раз адаптация глобального порога. Игры с глобальным порогом слабо помогают в спасении перемычек. Методы локальной адаптации(Саувола и др) хоть что-то делают в этом направлении.
Наверх
 

Сложно отбинаризировать черную перемычку на белой бумаге, особенно если её там нет.
 
IP записан
 
Владислав_72
Активист
***
Вне Форума



Сообщений: 319
Москва
Пол: male
Re: Создание DJVU-книг
Ответ #226 - 02.02.2021 :: 11:01:00
 
AAW писал(а) 01.02.2021 :: 10:52:09:
Владислав_72
Улыбка ну покажите коммерческий софт в помощь вопрошающему

Акробат устроит? По нажатию одной кнопки и распознает и центрирует текст скана в пдф по осям. Фотошоп еще есть. ДВЕ программы, покрывающие практически весь спектр создания е-книг.
Насчет бесплатного софта - нечасто авторы его разработки обращают внимание на удобство пользования им пользователей его и интерфейс, ибо разрабатывают как удобно ЕМУ, АВТОРУ, а не конечному пользователю. Анекдот, надеюсь, про 1С рассказывать не надо? Я сам в бытность свою недолго как разрабатывал комм.софт, так и занимался его дальнейшей техподдержкой в части желаемой пользователям визуализации интерфейсов взаимодействия и автоматизации операций, так что могу считать, что кое-что в этом понимаю.
Вот почему бы в DSM не добавить чуток интерфейсного кода по автоматизации распознавания обрабатываемых сканов в части распознавания типа исходника (монохром, полутона, цветной) и применения встроенных скриптов обработки? Ведь мелочь фича, а РЕАЛЬНО резко ускорило бы создание дежавю из уже обработанных сканов БЕЗ КАКИХ-ЛИБО операций последующего склеивания кусков дежавю в единое целое всякими DEE. Единственная попытка - создание СТ - и та ущербная донельзя. Я уж промолчу про интегрирование всей этой кучи разработанных утилит в области джвю-обработки в единое целое. Там программисты сидят или кто? Такое ощущение, что уровень этих самых программистов упал по самое не могу. А потом не удивляйтесь, что весь этот софт и весь этот набор операций вместе со всем стандартом дежавю оказывается нахрен никому не нужен, кроме отдельных гиков.
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
На Форуме


Старую детскую и НП литературу
ничем не заменить

Сообщений: 4657
Екатеринбург
Пол: male
Re: Создание DJVU-книг
Ответ #227 - 02.02.2021 :: 11:45:57
 
Владислав_72 писал(а) 02.02.2021 :: 11:01:00:
Фотошоп еще есть.

"по нажатию одной кнопки" Очень довольный фотошоп это конечно "одна кнопка". уморили.
Или акробат с jbig2 и автосегментером иллюстраций. "Одна большая головная боль" это, а не кнопка.

По-моему, лучше всего работает код от m7876, самописный. По слухам этого форума.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
AlVaKo
Активист
***
Вне Форума



Сообщений: 281
Алма-Ата
Пол: male
Re: Создание DJVU-книг
Ответ #228 - 02.02.2021 :: 14:01:18
 
Владислав_72 писал(а) 02.02.2021 :: 11:01:00:
Акробат устроит? По нажатию одной кнопки и распознает и центрирует текст скана в пдф по осям. Фотошоп еще есть. ДВЕ программы, покрывающие практически весь спектр создания е-книг.

Если есть такие могучие программы как ФШ и Акробат, которые за пару кликов делают из сканов качественный PDF. То наверное есть инструкция на пару страниц, которая описывает этот незамысловатый процесс. Где её можно почитать? Заодно, где это обилие качественных PDF из сканов, сделанных по такой инструкции?

Инструкция нужна краткая. Процесс должен быть не трудоемкий. А комерческий софт или нет, нам без разницы.
Наверх
 

Сложно отбинаризировать черную перемычку на белой бумаге, особенно если её там нет.
 
IP записан
 
slava_kry
Активист
***
Вне Форума



Сообщений: 488
Re: Создание DJVU-книг
Ответ #229 - 04.02.2021 :: 09:11:16
 
@
Владислав_72
Вы устали? Если да, то отдохните. Нет нужды распаляться.
Присутствующие здесь уже "гики в возрасте", ругаться на эти темы смысла не имеет. Нас мало... очень.
Программистов среди нас ещё меньше. Специфические задачи без денег практически никому неинтересны.
Помогать некому. Образовываться некому. Кнопки "сделать пиз..то" никогда не будет...
Всегда будет море программ или море действий, или всё вместе... Зачем распаляться на пустом месте?

@
AlVaKo
@
AAW

Остыньте товарищи, пожалуйста.
Наверх
 

Он сказал им: вы выказываете себя праведниками пред людьми, но Бог знает сердца ваши, ибо что высоко у людей, то мерзость пред Богом.
 
IP записан
 
m7876
Постоялец
**
Вне Форума



Сообщений: 96
Re: Создание DJVU-книг
Ответ #230 - 04.02.2021 :: 12:05:08
 
> По-моему, лучше всего работает код от m7876, самописный. По слухам этого форума.

Самописный не самописный, а в Fedora, OpenSUSE и Arch -- официальный пакет Улыбка

https://software.opensuse.org/package/img2djvu
https://fedora.pkgs.org/32/rpm-sphere-noarch/img2djvu-1.14-2.1.noarch.rpm.html
https://aur.archlinux.org/packages/img2djvu-git/
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
На Форуме


Старую детскую и НП литературу
ничем не заменить

Сообщений: 4657
Екатеринбург
Пол: male
Re: Создание DJVU-книг
Ответ #231 - 21.09.2021 :: 06:52:17
 
Набрёл на пример графики, которую таки можно делать ЧБ. Силуэтный рисунок, редкая штука, оказывается.
статья с примерами работ Протоклитова, на выставке увидел и отксерил
https://disk.yandex.ru/d/0DtSj89sgfyfXA
...

Хорошо видно, как алгоритм ксерокса убирает сплошную заливку, делает серый тон.
Буквально пара слов про жанр:
http://babanata.ru/?p=443

Интересно, что подобное в альбомах по выпиливанию в 1950е годы часто встречалось.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
Страниц: 1 ... 6 7 8 
Послать Тему Печать