OCR форумы Добро пожаловать, Гость. Пожалуйста, выберите Вход или Регистрация
Всем привет!
Hi all!
 
  ГлавнаяСправкаПоискВходРегистрация Администратор Библиотека  
 
Страниц: 1 
Послать Тему Печать
Переделка DjVu книг? (О переделке плохо сделанных книг) (Прочитано 52168 раз)
Ретро РЗиА
Новичок
*
Вне Форума



Сообщений: 19
Санкт-Петербург
Пол: male
Переделка DjVu книг? (О переделке плохо сделанных книг)
20.05.2008 :: 10:01:43
 
Здравствуйте, товарищи книголюбы

Спасибо Вам всем за полезные советы по книга деланию, но «все» они касаются как я понимаю обработки сырых сканов. Меня интересует вопрос обработки уже готовых DjVu с целью улучшения их потребительских качеств, таких как:

1.      Разрезание страниц;
2.      Очистка, выравнивание страниц и строк;
3.      Добавление OCR;
4.      Добавление автооглавление.

Если с третьим и четвертым пунктами мне все вроде понятно, то по первому и второму пунктам мне хотелось бы с вами посоветоваться.
Вопрос собственно в том, как сделать книгу, чтобы ее размер не увеличился, естественно он увеличиться за счет OCR, но это понятно, а сам DjVu файл без OCR как я понимаю должен оставаться меньше или,  по крайней мере,  примерно таким же.
Поделитесь опытом с «чайником» меня интересует все любая мелочь, размеры, форматы, программы, одним словом все, чтобы сделать книгу лучше.

P.S Я хочу привести в порядок литературу по релейной защите которой в сети при достаточно, но качество меня не устраивает, так же по- маленьку сканирую книги которые у меня есть и которые я не нашел в сети. В первую очередь меня интересует качество книг, для меня качество это те пункты, которые я перечислил выше.
Все это для моего сайта предназначенного  релейщикам.

С уважением, Никита

Наверх
« Последняя редакция: 28.07.2013 :: 11:57:50 от Dmitry7 »  

Ретро РЗиА – в помощь коллегам, все для технического обслуживания УРЗА
WWW 366627471  
IP записан
 
pohorsky
Патриарх
*****
Вне Форума


Подключайтесь к проекту
"Вся МРБ"!!!

Сообщений: 5904
Москва
Пол: male
Re: Переделка DjVu книг?
Ответ #1 - 20.05.2008 :: 11:57:27
 
Несколько раз пытался проделать такую работу, но ни чего хорошего не получалось.
Если DJVU 300 дпи, особенно если Scanned или Clean, то лучше не браться эффекта мало, а то и обратный.
Наверх
 
 
IP записан
 
Balabol
Новичок
*
Вне Форума


Всем привет!

Сообщений: 40
Re: Переделка DjVu книг?
Ответ #2 - 20.05.2008 :: 13:20:34
 
Никита,

я вообще никогда переделкой чужого не занимался (да и своего тоже). Так что разглагольствовать впустую не хочу.
Знаете что, лучше просто дайте ссылку на какой-нибудь неудачный файл (с небольшим числом страниц, чтобы много времени не терять). А кто захочет (может и я в т.ч.) пусть попробует прогнать его по своим методикам. Если кому удастся улучшить, то и напишет, как это делалось.
Наверх
 
 
IP записан
 
Ретро РЗиА
Новичок
*
Вне Форума



Сообщений: 19
Санкт-Петербург
Пол: male
Re: Переделка DjVu книг?
Ответ #3 - 20.05.2008 :: 14:59:24
 
Вот для примера два файла 1-й то, что было до, 2-й, что у меня получилось, но я не сомневаюсь, что можно сделать лучше, именно этот вариант потому как тут изначальный DjVu файл неплохой,  на мой взгляд, вечером если успею, то попробую выложить вариант похуже.

1.Исходный файл
2.Моя переделка

Есть еще одна мыслишка по поводу качества книги. Может, конечно, это уже у кого- то сделано, я просто не встречал.
Вот представьте себе, читаете вы электронную книгу, и на странице написано – «смотри рис.1», что вы делаете? Начинаете искать по страницам этот самый рис.1, а может просто делать ссылку на этот рисунок, а с рисунка обратно на текст,  ссылающийся на него, вроде это риализавать возможно, только остается вопрос,  а если на рисунок ссылаются сразу в нескольких местах на разных страницах? Еще лучше будет, если этот рисунок будет открываться в отдельном окошке. Что вы по этому поводу думаете?
Наверх
 

Ретро РЗиА – в помощь коллегам, все для технического обслуживания УРЗА
WWW 366627471  
IP записан
 
Kis
Активист
***
Вне Форума



Сообщений: 431
Россия, Москва
Пол: male
Re: Переделка DjVu книг?
Ответ #4 - 21.05.2008 :: 01:54:44
 
Такие файлы достаточно легко переделать с лучшим качеством в смысле djvu. Главная проблема исходника в том, что буквы "волосатые" и с дырками в 1-2 пикселя. Убрать эти недостатки поможет любая фотошопоподобная программа.

Вот рецепт, которым пользуюсь я (иллюстрации на 16 Mb можно взять тут):
1. Сохраняем картинку в формате tiff. Это умеют делать многие программы. Я воспользовался IrfanView. (См. файлы, начинающиеся на 00.)
2. Открываем первую картинку в Photoshop-е. Выставляем масштаб просмотра 100-300% в зависимости от предпочтений и опыта. Сохраненный tiff, скорее всего, получился черно-белым, и в этом случае меняем режим на Greyscale (Image -> Mode -> Greyscale...), Size Ratio ставим 1.
3. Применяем гауссово размытие (Filter -> Blur -> Gaussian Blur...). Радиус подбираем экспериментально, чтобы буквы стали менее волосатыми, но и в то же время сохранили свою форму. Для этого файла я выбрал 0.5 пикселя. (См. файлы, начинающиеся на 01.)
4. Применяем Smart Blur (Filter -> Blur -> Smart Blur...). Quality ставим High, Mode оставляем Normal. А вот Radius и Threshold надо подобрать экспериментально, и это, на мой взгляд, самое интеллектуальное во всей этой работе.
Дальше можно сделать довольно сильно отличающиеся варианты a) и b):
5а. Radius = 13, Threshold = 32. (См. файлы, начинающиеся на 02a.)
6a. Применяем Curves (Image -> Adjustments -> Curves, оно же Ctrl+M). Хватаем мышью по очереди две точки (черную и белую) на диагональной линии и, внимательно следя за изменениями картинки, делаем эту линию ломаной (см. скриншот CurvesA). Главная задача -- максимально избавиться от волосатости и от дырок, причем не в ущерб символам. (См. файлы, начинающиеся на 03a.)
5b. Radius = 10, Threshold = 90. (См. файлы, начинающиеся на 02b.)
6b. Применяем Curves (см. скриншот CurvesB и файлы, начинающиеся на 03b.)

Отличия вариантов a) и b):
В a) символы остались немного волосатыми, но зато они практически ничего не утратили.
В b) символы стали гладкими, но кое-где пропали тонкие линии.

Стоит поиграть еще значениями Radius и Threshold, а также параметрами у Curves -- наверняка удастся сделать картинку еще лучше. Гораздо легче обрабатывать серые сканы, не подвергшиеся варварской "битонализации". Мои любимые значения при обработке серых сканов -- это 11-13 для Radius и 27-33 для Threshold (это для 600dpi).

Мне больше понравился вариант a).

Дальше результаты можно сохранить как черно-белые изображения, покромсать ScanKromsator-ом и сделать djvu. Результаты прилагаются.
Наверх
« Последняя редакция: 21.05.2008 :: 08:27:13 от Kis »  
 
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5464
Екатеринбург
Пол: male
Re: Переделка DjVu книг?
Ответ #5 - 21.05.2008 :: 08:44:59
 
Kis, спасибо за науку!! А я пробовал зимой побаловаться с Smart Blur, но у меня ничего не вышло. Чувствовал что "терпелки" не хватило, и вот - ваш успешный опыт.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
Balabol
Новичок
*
Вне Форума


Всем привет!

Сообщений: 40
Re: Переделка DjVu книг?
Ответ #6 - 21.05.2008 :: 10:07:00
 
1. Размер у Ретро РЗиА получился у переделки большим из-за того, что в профиле было задано не очень сильное lossy и добавилось 22 кб ОЦР. Если сжать most-lossy (aggressive), то получится 44 кб (это без ОЦР). Но с agressive-ом надо быть, конечно, осторожным - больше шансов получить "инь"-замены.

2. Честно говоря, результаты не порадовали. Посмотрите хотя бы на то, что стало с формулами П3-10, 16, 27... Тонкие линии "съедаются" и мелкие буковки иногда разрываются. Наверное, это из-за того, что в Кромсаторе не очень хороший алгоритм поворота для ч-б сканов.

Я попробовал сделать поворот ImageProcessor-ом (лежит у Monday). Заодно и попытался сгладить лохматость в нем же (скриптом ImageSmooth). Предварительно разрезал сканы в Кромсаторе (без Descew и без Despecle). Результат немного получше (мне так кажется), но тоже не сахар:
http://ifolder.ru/6653054 (2 варианта - со сглаживанием и без).

Есть и другие идеи (вот только времени на эксперименты сейчас совсем нет):
а) попробовать поднять dpi до 600, а потом уже резать и сглаживать ступенчатые буквы Фотошопом (да бог с ним, с  размером). Тогда тонкие линии, наверное, не пропадут.
б) попробовать перевести картинки в серый цвет, слегка размыть и тогда уже поворачивать их Кромсатором и  делать все остальное как в Scan&Share.
Наверх
 
 
IP записан
 
Ретро РЗиА
Новичок
*
Вне Форума



Сообщений: 19
Санкт-Петербург
Пол: male
Re: Переделка DjVu книг?
Ответ #7 - 21.05.2008 :: 13:08:39
 
Всем спасибо за советы и примеры, буду думать и пробовать, к сожалению,  как и у всех времени на это остается мало, поэтому все так медленно тянется.
К слову сказать, думаю,  что если уж сканы совсем плохие то можно поступать извращенным способом, а именно выделять tiff повышать их до 600 dpi, потом распознавать в FineReader сохранять все в pdf,  а уже pdf напрямую в  DjVu это конечно уже извращение но зато качество получается отличное.
Еще вопросы немного не для этой темы, он связан с конвертацией  pdf напрямую в  DjVu

1.Какую программу для этого выбрать я пробовал Document Express Enterprise with DjVu v5.1 build 946 (with Asian OCR) размер остался один в один, попробовал перегнать все в tiff, а потом уже в DjVu размер уменьшился в 2,5 раза при этом качество практически не поменялось. Есть программы, которые на прямую делать DjVu  из pdf меньше?

И еще есть смысл искать FineReader 9 или нет, чем он лучше?


С уважением, Никита
Наверх
 

Ретро РЗиА – в помощь коллегам, все для технического обслуживания УРЗА
WWW 366627471  
IP записан
 
Ретро РЗиА
Новичок
*
Вне Форума



Сообщений: 19
Санкт-Петербург
Пол: male
Re: Переделка DjVu книг?
Ответ #8 - 21.05.2008 :: 13:14:53
 
Еще забыл спросить, правда ли, что во всех программах для конвертации в  DjVu фалы получаются разные по размерам в смысле килобайтам, если это так, то посоветуйте самую оптимальную программу в этом плане, но что бы качество не страдало. Я пользуюсь для этого Document Express Editor v6.0.1 Build 1320 LE (for NT) (Light Edition for NT)
Наверх
 

Ретро РЗиА – в помощь коллегам, все для технического обслуживания УРЗА
WWW 366627471  
IP записан
 
Balabol
Новичок
*
Вне Форума


Всем привет!

Сообщений: 40
Re: Переделка DjVu книг?
Ответ #9 - 22.05.2008 :: 06:18:53
 
Ретро РЗиА писал(а) 20.05.2008 :: 14:59:24:
Есть еще одна мыслишка по поводу качества книги. Может, конечно, это уже у кого- то сделано, я просто не встречал.
Вот представьте себе, читаете вы электронную книгу, и на странице написано – «смотри рис.1», что вы делаете? Начинаете искать по страницам этот самый рис.1, а может просто делать ссылку на этот рисунок, а с рисунка обратно на текст,  ссылающийся на него, вроде это риализавать возможно, только остается вопрос,  а если на рисунок ссылаются сразу в нескольких местах на разных страницах? Еще лучше будет, если этот рисунок будет открываться в отдельном окошке. Что вы по этому поводу думаете?

Да, удобнее, когда есть гиперссылки. Вставлять их можно с помощью Document Express Editor (это усовершенствованный Djvu Solo). Просто рисуется рамочка и указывается # страницы в книге, на которую нужно прыгнуть. Чтобы читатель мог понять, что тут есть гиперссылка, можно сделать видимую границу или фон для этой рамочки.  Вот, например, книжка с ссылками "туда-сюда":
http://publ.lib.ru/ARCHIVES/_NIT_VOE/Sredniy_artilleriyskiy_tyagach_AT-C.(1960)....
А чтоб в отдельном окошке, это, наверное, в djvu сделать нельзя.
Цитата:
Какую программу для этого выбрать я пробовал Document Express Enterprise with DjVu v5.1 build 946 (with Asian OCR) размер остался один в один, попробовал перегнать все в tiff, а потом уже в DjVu размер уменьшился в 2,5 раза при этом качество практически не поменялось.

Думаю, что исходный файл кодировался с другими настройками. Может быть с опцией loseless ("без потерь"), чтобы избежать появления инь-замен. Из-за чего-то другого размер бы так сильно не изменился.
Цитата:
Еще забыл спросить, правда ли, что во всех программах для конвертации в  DjVu фалы получаются разные по размерам в смысле килобайтам, если это так, то посоветуйте самую оптимальную программу в этом плане, но что бы качество не страдало.

Если у Вас DEE, то не стоит заморачиваться с поиском другой проги. У DEE самые большие возможности настроек. Разве что, можно взять самую компактную версию DEE - Djvu Small из которой все излишества выброшены (но все опции кодирования при этом остались).
А программы-кодировщики действительно неоднократно сравнивались, но разница там не настолько велика, чтобы что-то однозначно предпочесть. По сжатию ч-б страниц победил, кажется, MiniDjvu.
Цитата:
Есть программы, которые на прямую делать DjVu  из pdf меньше?

Точно не знаю, но кажется есть утилита pdf2djvu. А еще есть виртуальный Djvu-принтер.
Цитата:
К слову сказать, думаю,  что если уж сканы совсем плохие то можно поступать извращенным способом, а именно выделять tiff повышать их до 600 dpi, потом распознавать в FineReader сохранять все в pdf,  а уже pdf напрямую в  DjVu это конечно уже извращение но зато качество получается отличное.

Действительно, извращение Улыбка Растр -> вектор -> опять растр... Последняя стадия, думаю, излишняя.
Цитата:
еще есть смысл искать FineReader 9 или нет, чем он лучше?

Найти ее не проблема и установить вдобавок к другой версии тоже (она не требует сноса старых версий). Но я думаю, что 7-8 версии лучше. 9ка слишком сырая. И DjvuOCR не понимает ее пакеты.
Наверх
 
 
IP записан
 
Ретро РЗиА
Новичок
*
Вне Форума



Сообщений: 19
Санкт-Петербург
Пол: male
Re: Переделка DjVu книг?
Ответ #10 - 22.05.2008 :: 10:37:30
 
Для Balabol!

Спасибо.............. Улыбка
Наверх
 

Ретро РЗиА – в помощь коллегам, все для технического обслуживания УРЗА
WWW 366627471  
IP записан
 
Historic9
Новичок
*
Вне Форума


Всем привет!

Сообщений: 18
Re: Переделка DjVu книг?
Ответ #11 - 25.11.2012 :: 22:25:35
 
Уважаемые участники, пожалуйста, подскажите, какой программой можно "исправить" DjVu-книгу таким образом, чтобы страницы в ней не сдвигались влево-вправо (например, при поиске).
Наверх
 
 
IP записан
 
joker2156
Активист
***
Вне Форума



Сообщений: 285
Re: Переделка DjVu книг?
Ответ #12 - 29.12.2012 :: 07:01:04
 
Historic9 писал(а) 25.11.2012 :: 22:25:35:
"исправить" DjVu-книгу таким образом, чтобы страницы в ней не сдвигались влево-вправо (например, при поиске).


Старый анекдот: Сивка Бурка Вещая Каурка, встань передо мной как лист перед травой.
- Иван, вы бы поконкретнее выражались как вставать, а то у нас, у лошадей, ассоциативный ряд-то послабее.

Лично я совсем не понял, что такое "сдвигались влево-вправо при поиске". В какой программе ищете, куда сдвигается и т.д.?
Наверх
 
 
IP записан
 
Dmitry7
Модератор
*****
Вне Форума


Соберем Серии "НВЖНиТ"!

Сообщений: 5891
Санкт-Петербург
Пол: male
Re: Переделка DjVu книг?
Ответ #13 - 29.12.2012 :: 14:25:23
 
Historic9 писал(а) 25.11.2012 :: 22:25:35:
Уважаемые участники, пожалуйста, подскажите, какой программой можно "исправить" DjVu-книгу таким образом, чтобы страницы в ней не сдвигались влево-вправо (например, при поиске).


вы имели в виду, есть ли программа, которая может обрезать страницы (или добавлять поля) в готовом djvu, не искажая содержимого ? (если в книге левые и правые поля сделаны неодинаковыми, или вообще размер страниц разный)
Мне тоже нужна такая программа, но пока не могу найти (и желательно, чтобы для каждой страницы можно было задавать индивидуальные параметры, как в СК).

СК для этой цели использовать неудобно - надо загрузить готовую книгу в СК в виде картинок, затем снова прогнать через обрезку, выравнивая поля - очень долго. Нужна простая прога, которая хотя бы позволяла задать одинаковые поля для всех страниц в готовой djvu-книге (или сдвиг полей).
Наверх
 

"Если хочешь сделать что-то хорошо, сделай это сам!"
332371574  
IP записан
 
Historic9
Новичок
*
Вне Форума


Всем привет!

Сообщений: 18
Re: Переделка DjVu книг?
Ответ #14 - 31.12.2012 :: 16:39:48
 
joker2156 писал(а) 29.12.2012 :: 07:01:04:
Лично я совсем не понял, что такое "сдвигались влево-вправо при поиске". В какой программе ищете, куда сдвигается и т.д.?


Программа - STDU Viewer. Иногда встречаются книги (разрезанные постранично), в которых страницы сдвигаются "рукой" не только вверх-вниз, но и влево-вправо. Если ввести в поиск слово и проявлять полученные результаты, каждый раз нужная страница будет показана не ровно (на весь экран или посередине), а где попало, причём её часть может быть даже не видна в случае, когда она сильно сдвинута в какую-либо сторону.
Я пытаюсь устранить данное неудобство. У Вас есть необходимая программа или способ устранения?
Наверх
 
 
IP записан
 
Dmitry7
Модератор
*****
Вне Форума


Соберем Серии "НВЖНиТ"!

Сообщений: 5891
Санкт-Петербург
Пол: male
Re: Переделка DjVu книг?
Ответ #15 - 31.12.2012 :: 17:04:11
 
Historic9 писал(а) 31.12.2012 :: 16:39:48:
Программа - STDU Viewer. Иногда встречаются книги (разрезанные постранично), в которых страницы сдвигаются "рукой" не только вверх-вниз, но и влево-вправо. Если ввести в поиск слово и проявлять полученные результаты, каждый раз нужная страница будет показана не ровно (на весь экран или посередине), а где попало, причём её часть может быть даже не видна в случае, когда она сильно сдвинута в какую-либо сторону.
Я пытаюсь устранить данное неудобство. У Вас есть необходимая программа или способ устранения?

STDU Viewer никогда не пользовался.

а попробуйте посмотреть программой WinDjView 2.0.2 (потом расскажите, лучше ли стал просмотр?)
http://soft.softodrom.ru/ap/WinDjView-p6604

(и если можно, выложите подобную книгу для образца на файлообменник)

Наверх
 

"Если хочешь сделать что-то хорошо, сделай это сам!"
332371574  
IP записан
 
Historic9
Новичок
*
Вне Форума


Всем привет!

Сообщений: 18
Re: Переделка DjVu книг?
Ответ #16 - 31.12.2012 :: 18:03:45
 
Dmitry7 писал(а) 31.12.2012 :: 17:04:11:
(и если можно, выложите подобную книгу для образца на файлообменник)


Ссылка - http://dfiles.ru/files/gfjjagpol.
Наверх
 
 
IP записан
 
joker2156
Активист
***
Вне Форума



Сообщений: 285
Re: Переделка DjVu книг?
Ответ #17 - 01.01.2013 :: 00:01:44
 
Historic9 писал(а) 31.12.2012 :: 18:03:45:
Ссылка

У меня в данном файле OCR не виден, потому искать нечего, ситуация же когда страница "распахнута" по ширине но тем не менее может сдвигаться, скорее всего, означает, что в книги есть страницы которые шире.  stdu, вероятно, считает ширину книги по самой большой странице. Исправлением книги едва ли что-то можно добиться, разве что изменить страницы, приведя их к одной ширине. Если хочется работать именно с stdu - пишите им в саппорт, только поконкретнее, со скриншотами и т.д. Раньше они активно отвечали; и по-русски. Не так давно писал - не ответили.
Наверх
 
 
IP записан
 
Historic9
Новичок
*
Вне Форума


Всем привет!

Сообщений: 18
Re: Переделка DjVu книг?
Ответ #18 - 01.01.2013 :: 12:38:02
 
joker2156 писал(а) 01.01.2013 :: 00:01:44:
У меня в данном файле OCR не виден, потому искать нечего...


Да, это я невнимательно закачал файл без текстового слоя. Вот http://dfiles.ru/files/9ipw39uus.
Что такое "саппорт"?
Наверх
 
 
IP записан
 
Dmitry7
Модератор
*****
Вне Форума


Соберем Серии "НВЖНиТ"!

Сообщений: 5891
Санкт-Петербург
Пол: male
Re: Переделка DjVu книг?
Ответ #19 - 01.01.2013 :: 13:36:46
 
Historic9 писал(а) 01.01.2013 :: 12:38:02:
Да, это я невнимательно закачал файл без текстового слоя. Вот http://dfiles.ru/files/9ipw39uus.
Что такое "саппорт"?

в windjview посмотрели? то же самое, сдвигается?

p.s. саппорт - здесь: служба поддержки фирмы-разработчика программы
Наверх
 

"Если хочешь сделать что-то хорошо, сделай это сам!"
332371574  
IP записан
 
Historic9
Новичок
*
Вне Форума


Всем привет!

Сообщений: 18
Re: Переделка DjVu книг?
Ответ #20 - 01.01.2013 :: 17:35:46
 
Dmitry7 писал(а) 01.01.2013 :: 13:36:46:
в windjview посмотрели? то же самое, сдвигается?


К сожалению, да.
Наверх
« Последняя редакция: 01.01.2013 :: 17:43:36 от Historic9 »  
 
IP записан
 
Dmitry7
Модератор
*****
Вне Форума


Соберем Серии "НВЖНиТ"!

Сообщений: 5891
Санкт-Петербург
Пол: male
Re: Переделка DjVu книг?
Ответ #21 - 01.01.2013 :: 22:00:42
 
Historic9 писал(а) 01.01.2013 :: 17:35:46:
К сожалению, да.


а какие настройки просмотра Вы выставили? (по ширине, по странице, 100%, .... или ? ) и смотрите разворотами или постранично?

дело в том, что там есть развороты большого размера, если выставить не фиксированный в % масштаб, то возможны прыжки при некоторых настройках
Наверх
 

"Если хочешь сделать что-то хорошо, сделай это сам!"
332371574  
IP записан
 
Historic9
Новичок
*
Вне Форума


Всем привет!

Сообщений: 18
Re: Переделка DjVu книг?
Ответ #22 - 02.01.2013 :: 17:37:13
 
Dmitry7 писал(а) 01.01.2013 :: 22:00:42:
а какие настройки просмотра Вы выставили? (по ширине, по странице, 100%, .... или ? ) и смотрите разворотами или постранично?


150%, постранично. В принципе, эффект остался. Но теперь, по крайней мере, при поиске нет самопроизвольного сдвига в сторону. Спасибо Вам за ценную информацию о программе WinDjView 2.0.2.
Наверх
 
 
IP записан
 
Dmitry7
Модератор
*****
Вне Форума


Соберем Серии "НВЖНиТ"!

Сообщений: 5891
Санкт-Петербург
Пол: male
Re: Переделка DjVu книг?
Ответ #23 - 02.01.2013 :: 18:08:51
 
ок.
+иногда удобнее смотреть с масштабом "страница целиком", разворотами, особенно если большой монитор
Наверх
 

"Если хочешь сделать что-то хорошо, сделай это сам!"
332371574  
IP записан
 
Dmitry7
Модератор
*****
Вне Форума


Соберем Серии "НВЖНиТ"!

Сообщений: 5891
Санкт-Петербург
Пол: male
О переделках плохо сделанных в других б-ках книг
Ответ #24 - 22.05.2011 :: 11:45:51
 
.
В сети гуляет масса плохочитаемых (плохосканированных, плохобинаризированных/переведенных в эл. вид с потерями и просто сделанных с плохого оригинала) книг.

Вопрос: насколько имеет смысл переделывать такие книги, и каков критерий отбора для переделки?

и вообще, кто посоветует лучшую пошаговую методику переделки для разных случаев?

1. djvu с очень низким разрешением 100-400 dpi
2. серый/цветной фон без очистки изображений
3. pdf-изображения - книги гигантского размера
4. просто набор картинок/сканов плохого качества
5... и т.п.
Наверх
« Последняя редакция: 24.06.2011 :: 19:25:36 от Dmitry7 »  

"Если хочешь сделать что-то хорошо, сделай это сам!"
332371574  
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5464
Екатеринбург
Пол: male
Re: О переделках плохо сделанных книг
Ответ #25 - 22.05.2011 :: 12:06:19
 
Dmitry7 писал(а) 22.05.2011 :: 11:45:51:
Вопрос: насколько имеет смысл переделывать такие книги, и каков критерий отбора для переделки?

Для меня один-единственный критерий: книга нравится/хочу прочесть/показать детям, а пытаюсь читать - и плююсь из-за качества.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
Dmitry7
Модератор
*****
Вне Форума


Соберем Серии "НВЖНиТ"!

Сообщений: 5891
Санкт-Петербург
Пол: male
Re: О переделках плохо сделанных книг
Ответ #26 - 22.05.2011 :: 12:13:57
 

на мой взгляд, этим часто грешат в основном торрент-трекеры. им выгоднее не качество, а размер. для повышения рейтинга раздающего. качество при этом не всегда страдает, но размер просто неразумный, как у журналов ТМ и НиЖ по 60-100 Мб...
Наверх
 

"Если хочешь сделать что-то хорошо, сделай это сам!"
332371574  
IP записан
 
Dark_Ambient
Новичок
*
Вне Форума


Всем привет!

Сообщений: 37
Пол: male
Re: О переделках плохо сделанных книг
Ответ #27 - 22.05.2011 :: 13:07:43
 
Dmitry7 писал(а) 22.05.2011 :: 12:13:57:
на мой взгляд, этим часто грешат в основном торрент-трекеры. им выгоднее не качество, а размер. для повышения рейтинга раздающего. качество при этом не всегда страдает, но размер просто неразумный, как у журналов ТМ и НиЖ по 60-100 Мб...

вот уж дудки
я лично многие раннесканированные мной книги переделываю, улучшаю качество-уменьшаю размер
Наверх
 
 
IP записан
 
Dmitry7
Модератор
*****
Вне Форума


Соберем Серии "НВЖНиТ"!

Сообщений: 5891
Санкт-Петербург
Пол: male
Re: О переделках плохо сделанных книг
Ответ #28 - 22.05.2011 :: 13:17:06
 
Dark_Ambient писал(а) 22.05.2011 :: 13:07:43:
вот уж дудки
я лично многие раннесканированные мной книги переделываю, улучшаю качество-уменьшаю размер

да я тоже.
но к сожалению, не все так делают
Наверх
 

"Если хочешь сделать что-то хорошо, сделай это сам!"
332371574  
IP записан
 
dns
Гуру
****
Вне Форума


Всем привет!

Сообщений: 942
Красноярск
Пол: male
Re: О переделках плохо сделанных книг
Ответ #29 - 22.05.2011 :: 14:09:16
 
Пункты 1,4 - редко когда что-нибудь путное получается. Лучше пересканировать, если есть возможность.
Пункт 2 - бывает что получается неплохо, текст во всяком случае и битональная графика. Я обычно делал вручную в фотошопе: тоновая коррекция, отдельно осветление затененных участков, бинаризация, кодирование.
Пункт 3 - если dpi в pdf позволяет - экспорт в графику и дальше Кромсатором как со сканами.
Наверх
 
 
IP записан
 
Сергей
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 73
Re: Переделка DjVu книг? (О переделке плохо сделанных книг)
Ответ #30 - 23.11.2013 :: 00:32:17
 
Порезал и почистил ЮТ-1960-3 и ЮТ-1965-7. Насколько плохо получилось и стоит так делать? В архиве оригиналы и что получилось.

ЮТ-1960-3,1965-7.zip/rar - 15,8Мб - http://rusfolder.net/files/38895204
Наверх
 
 
IP записан
 
GMAP
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 52
Somewhere there...
Пол: male
Re: Переделка DjVu книг? (О переделке плохо сделанных книг)
Ответ #31 - 23.11.2013 :: 09:51:29
 
Из таких "оригиналов" уже ничего не сделаешь, сплошные ошибки "инь", читать неприятно. Никакая обработка не поможет изувеченному журналу, увы. Только заново сканировать, других приемлемых способов нет.
Наверх
 
 
IP записан
 
Сергей
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 73
Re: Переделка DjVu книг? (О переделке плохо сделанных книг)
Ответ #32 - 23.11.2013 :: 10:56:44
 
Спасибо.
Наверх
 
 
IP записан
 
joker2156
Активист
***
Вне Форума



Сообщений: 285
Re: Переделка DjVu книг? (О переделке плохо сделанных книг)
Ответ #33 - 24.11.2013 :: 08:08:02
 
Сергей писал(а) 23.11.2013 :: 00:32:17:
Насколько плохо получилось и стоит так делать? В архиве оригиналы и что получилось.

О, 65й я помню, у меня точно был, и вроде даже приемник собирал, но 99% что не найду - скорее всего добрые родственники выкинули. По поводу "стоит ли" - если для тренировки - так чего ж, набивать руку на чем-то надо, но пока получается не очень - посмотрите сами, нельзя просто осветлить все страницы, иногда по часу каждую приходится обрабатывать, например 60й год, страница 20, там где рисунок солнечной системы - в оригинале еще как-то можно рассмотреть, а в "улучшеном" варианте почти ничего не осталось. Тот же номер, страница 13 - пришлось смотреть в оригинал, чтобы понять, что это вообще изображено - догадаться, что это изометрия разреза подземного  строения - непросто. Мне не удалось, может потому что "к старости слаба глазами стала". Страница 28 - наоборот, зачем-то остались грязные желтые разводы в фоне, и т.д. Кстати 65й год, страница 54, там где результаты теста, у меня была с полиграфическим браком - цвета были смещены, потому вместо зеленых букв была расплывчатая мешанина, судя по файлу у меня был не эксклюзив Улыбка Так что если вдруг попадется бумажный номер к обработке - на мой взгляд имело бы смысл это дело поправить.
Но в целом, конечно, изначальные варианты были сильно убиты и пережаты, и сделать из них что-то приличное - невероятно.
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5464
Екатеринбург
Пол: male
Re: Переделка DjVu книг? (О переделке плохо сделанных книг)
Ответ #34 - 24.11.2013 :: 09:49:26
 
IMHO, не надо тратить силы на такую, почти бессмысленную, работу. Это же не раритет 14го века, единственный на планету, а массовый журнал второй половины 20го. Тренироваться - так с двойной пользой, чтоб книга хорошая вышла. На этом оригинале это невозможно, он убитый.
Если очень нужно - предоставлю сканы этих журналов из офиц.диска ЮТ, или пересканю свои экземпляры. Но вообще-то в Сети валяется масса плохосделанных хороших книжек, которые еще _можно_ привести в приличный вид. Навскидку и по памяти, Тур Хейердал, Искусство острова Пасхи, просится в добрые руки. полугиговая пдфка.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
Сергей
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 73
Re: Переделка DjVu книг? (О переделке плохо сделанных книг)
Ответ #35 - 24.11.2013 :: 12:28:37
 
Да, решил потренироваться. Действительно, на восстановление букв (на бумаге местами ничего не пропечаталось), на одной из страниц книги (сейчас обрабатываю, не знаю когда сделаю) ушло около з-х часов.
Наверх
 
 
IP записан
 
AlVaKo
Гуру
****
Вне Форума



Сообщений: 523
Алма-Ата
Пол: male
Re: Переделка DjVu книг? (О переделке плохо сделанных книг)
Ответ #36 - 24.11.2013 :: 16:18:15
 
AAW писал(а) 24.11.2013 :: 09:49:26:
Навскидку и по памяти, Тур Хейердал, Искусство острова Пасхи, просится в добрые руки. полугиговая пдфка.


Есть у меня это книжка.
Если кто возьмется за переделку, и встретит дефект, то единичные страницы могу отсканировать.
Наверх
« Последняя редакция: 24.11.2013 :: 16:30:49 от AlVaKo »  

Сложно отбинаризировать черную перемычку на белой бумаге, особенно если её там нет.
 
IP записан
 
keruana
Новичок
*
Вне Форума


Всем привет!

Сообщений: 41
Пол: female
Re: К вопросу об энтузиастах оцифровки...
Ответ #37 - 14.02.2015 :: 19:05:58
 
Не знаю в какую тему идти со своими вопросами.) Спрошу здесь.
Давным-давно), я отсканировала и распознала в док. брошюру "Зелёное удобрение на садовом участке" Н.М. Жирмунская "Маркетинг" 1995 год. Она есть в сети, залила на Либрусек. Но тогда я не собиралась выкладывать что-то в нет и делала это для близких людей, поэтому обложка меня не интересовала. Вот теперь, после длительных поисков, мне удалось опять заполучить её на несколько дней, в первую очередь, конечно, искала ради скана обложки, хотя, не велика ценность.) Вот теперь два вопроса.
1. Если кого-то интересует эта брошюра, я могу отсканировать по-быстрому, всего-то 42 страницы.
2. Из-за низкой скорости у меня большие проблемы с заливкой на обменники, обрывается часто. Допустимо ли передавать сканы, закодированные djvu_small?
Собственно, всё.)
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5464
Екатеринбург
Пол: male
Re: Переделка DjVu книг? (О переделке плохо сделанных книг)
Ответ #38 - 14.02.2015 :: 22:58:24
 
нее, что-то тут не то. Кодированные сканы - уже не сканы, а готовая книга.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
Dmitry7
Модератор
*****
Вне Форума


Соберем Серии "НВЖНиТ"!

Сообщений: 5891
Санкт-Петербург
Пол: male
Re: Переделка DjVu книг? (О переделке плохо сделанных книг)
Ответ #39 - 14.02.2015 :: 23:36:46
 
AAW писал(а) 14.02.2015 :: 22:58:24:
нее, что-то тут не то. Кодированные сканы - уже не сканы, а готовая книга.

кодированные djvu_small без специальной обработки скорее всего не восстановить потом будет...
Наверх
 

"Если хочешь сделать что-то хорошо, сделай это сам!"
332371574  
IP записан
 
keruana
Новичок
*
Вне Форума


Всем привет!

Сообщений: 41
Пол: female
Re: Переделка DjVu книг? (О переделке плохо сделанных книг)
Ответ #40 - 15.02.2015 :: 08:47:07
 
Почему нет? То есть я вполне допускаю, что нет, только аргументируйте. В пространстве моего компа после декодирования все параметры скана сохраняются. Для чистоты эксперимента:  DjVu Small v0.4.4, вес сканов - 123 Мб каждого. Отсканировано 600 dpi 8206x5252 пкс.
Этой книги нет в нете, красивое оформление. С удовольствием бы отдала сканы в руки профи.)
http://rghost.ru/7jvm9sC2N
Наверх
 
 
IP записан
 
Dmitry7
Модератор
*****
Вне Форума


Соберем Серии "НВЖНиТ"!

Сообщений: 5891
Санкт-Петербург
Пол: male
Re: Переделка DjVu книг? (О переделке плохо сделанных книг)
Ответ #41 - 15.02.2015 :: 10:57:56
 
keruana писал(а) 15.02.2015 :: 08:47:07:
Почему нет? То есть я вполне допускаю, что нет, только аргументируйте. В пространстве моего компа после декодирования все параметры скана сохраняются. Для чистоты эксперимента:  DjVu Small v0.4.4, вес сканов - 123 Мб каждого. Отсканировано 600 dpi 8206x5252 пкс.
Этой книги нет в нете, красивое оформление. С удовольствием бы отдала сканы в руки профи.)
http://rghost.ru/7jvm9sC2N

Вообще-то при кодировании получается сжатие с потерями, иначе такого маленького результирующего размера не добиться. И если Вы переконвертируете из djvu обратно в TIFF или, какой там был исходный формат сканов, то увидите разницу - потеряются мелкие детали в картинках, края букв расплываются, четкости не будет такой, какой она была сразу после сканирования. Поэтому обычно сканы для обработчиков предлагают в незакодированном формате, в крайнем случае, в jpg с малыми потерями.
1. В каком формате у Вас исходные сканы? Какого размера в сумме?
2. Вы можете залить на обменник сканы в формате jpg (с максимальным качеством)? Сколько они займут объема, в отличие от исходных?
3. И какой профиль Вы выбирали в программе djvu small для приведенного примера? Фото?
Наверх
 

"Если хочешь сделать что-то хорошо, сделай это сам!"
332371574  
IP записан
 
keruana
Новичок
*
Вне Форума


Всем привет!

Сообщений: 41
Пол: female
Re: Переделка DjVu книг? (О переделке плохо сделанных книг)
Ответ #42 - 15.02.2015 :: 12:49:00
 
Исходные сканы в bmp. Суммы нет, так как книга не отсканирована полностью. Попробуйте понять мою логику: зачем мне её сканировать, если я не буду ( по ряду причин), ей заниматься. Это имеет смысл сделать только в том случае, если есть человек, кто пожелает её сделать в дежавю в хорошем качестве. Сделала три скана, все по 123 Мб. В книге грубо 320 страниц, вот подсчитайте. О-го-го!) Почему и подняла вопрос с кодировкой.)
При кодировке в djvu small всё просто 600 dpi цветной без потерь качества ПП 100. Профиля фото у меня нет, или не нашла.)
Наверх
 
 
IP записан
 
AlVaKo
Гуру
****
Вне Форума



Сообщений: 523
Алма-Ата
Пол: male
Re: Переделка DjVu книг? (О переделке плохо сделанных книг)
Ответ #43 - 15.02.2015 :: 13:26:01
 
При кодировке сырого скана происходит нежелательная автоматическая обработка изображения самим кодировщиком.
Посмотрите на 80 стр книги в Вашем файле DjVu, самый низ, где текст синим цветом. Частички букв "растворились" в фоне. Вертикальная синия линия тоже испорчена. А был бы оригинальный скан, потом обработка и только потом кодировка, то в такой djvu-шке  таких дефектов не было бы.
Наверх
 

Сложно отбинаризировать черную перемычку на белой бумаге, особенно если её там нет.
 
IP записан
 
keruana
Новичок
*
Вне Форума


Всем привет!

Сообщений: 41
Пол: female
Re: Переделка DjVu книг? (О переделке плохо сделанных книг)
Ответ #44 - 15.02.2015 :: 13:50:52
 
AlVaKo
Спасибо.) Разглядели. Тут не поспоришь.
Наверх
 
 
IP записан
 
Lykas
Патриарх
*****
Вне Форума


Всем привет!

Сообщений: 1081
Re: Переделка DjVu книг? (О переделке плохо сделанных книг)
Ответ #45 - 17.02.2015 :: 11:24:51
 
Зачем так много?
Свои промежуточные сканы храню в JPG 60% 300 Dpi.
Для последующей обработки хватает. И размер файлов порядка метр-полтора на формат А4.
На крайний случай можно упаковать в архив и переименовать в комиксовский тип CBZ или CBR.
Посмотрел образцы. Такие книги я режу по размеру, убираю желтый фон, собираю в PDF. И все. Делать в качественный Djvu сильно долго. Надо делать методом вклейки страниц и потом раскрашивать.
Наверх
 
 
IP записан
 
Страниц: 1 
Послать Тему Печать