OCR форумы Добро пожаловать, Гость. Пожалуйста, выберите Вход или Регистрация
Всем привет!
Hi all!
 
  ГлавнаяСправкаПоискВходРегистрация Администратор Библиотека  
 
Переключение на Главную Страницу Страниц: 1
Послать Тему Печать
Требуется помощь в обработке цветных вклеек (Прочитано 19789 раз)
nbl
Гуру
****
Вне Форума



Сообщений: 502
Кузбасс
Пол: male
Требуется помощь в обработке цветных вклеек
06.09.2011 :: 09:12:24
 
Сейчас отсканировал и делаю DjVu книги Романа Кима "Девушка из Хиросимы". В книге есть четыре цветных вклейки. У меня не получается их нормально обработать, не умею я с цветными рисунками работать. Никто не желает помочь?

Сканы лежат на обменнике:
http://rghost.ru/20601281
Наверх
« Последняя редакция: 22.04.2012 :: 12:49:21 от Dmitry7 »  
 
IP записан
 
pohorsky
Патриарх
*****
Вне Форума


Подключайтесь к проекту
"Вся МРБ"!!!

Сообщений: 5916
Москва
Пол: male
Re: Требуется помощь в обработке
Ответ #1 - 06.09.2011 :: 11:41:03
 
Кодируйте как фото 300дпи, вставляйте  в ч/б djvu и дело с концом.
Наверх
 
 
IP записан
 
Валентин Бородей
Постоялец
**
Вне Форума



Сообщений: 167
Re: Требуется помощь в обработке
Ответ #2 - 06.09.2011 :: 11:43:26
 
Что-то типа этого требуется http://www.onlinedisk.ru/file/727472/ ? Если да, то сделаю. Правда забыл как в кромсаторе с "magic clear" работать. Если бы уважаемый (sic) bolega напомнил Улыбка.
Наверх
 
 
IP записан
 
nbl
Гуру
****
Вне Форума



Сообщений: 502
Кузбасс
Пол: male
Re: Требуется помощь в обработке
Ответ #3 - 06.09.2011 :: 13:05:41
 
Ваш вариант хороший. Но прежде, чем дальше что-то делать, прошу посмотреть и оценить мой результат. Меня он устраивает, и если претензий к нему не будет, то оставлю его.

Вот ссылка:
http://rghost.ru/20616471
Наверх
 
 
IP записан
 
Валентин Бородей
Постоялец
**
Вне Форума



Сообщений: 167
Re: Требуется помощь в обработке
Ответ #4 - 06.09.2011 :: 15:39:13
 
Ну я бы так лица не выбеливал - японцы всё-таки Очень довольный. Да и цвета немного убежали от оригинала. А в целом - нормально.
Наверх
 
 
IP записан
 
nbl
Гуру
****
Вне Форума



Сообщений: 502
Кузбасс
Пол: male
Re: Требуется помощь в обработке
Ответ #5 - 06.09.2011 :: 15:55:30
 
Ну, в книге лица такого же цвета, как сам бумажный лист. Вообще, эти картинки малоцветные, примерно такие и получились у меня, только оттенки чуть сместились. Это да. Будем считать, что у них лица после взрыва побледнели  Улыбка
Наверх
« Последняя редакция: 06.09.2011 :: 17:36:37 от nbl »  
 
IP записан
 
папаВлад
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 100
Подмосковье
Пол: male
Re: Требуется помощь в обработке
Ответ #6 - 01.11.2011 :: 02:16:21
 
И мне требуется помощь в обработке.

Не могу правильно сжать вот такую картинку: jpg = 2,7 Мб
http://s49.radikal.ru/i123/1110/ae/e9d1a2df919a.jpg

Точнее сжал, конечно, с профилем фото, но Вадим будет на меня косо смотреть, если я пришлю файлы по 25 Мб ))

Второй день размазываю эти фотки, и сжимаю разными способами. Теперь понял, что сам не справлюсь с микробами, пожирающими портреты.

Одна из неудачных попыток: djvu = 5,8 Мб
http://papavlad.ucoz.ru/raznoe/Niva.1905-01.djvu
- страница 19.

Вот, с размазыванием, но тоже плохо: jpg = 1,2 Мб
http://s017.radikal.ru/i405/1110/10/c017c7cc2e26.jpg

Или вполне удачный чёрно/белый: png = 400 кб
http://s44.radikal.ru/i103/1110/86/f04f16e87006.png
но это сжатие не подходит к похожим картинкам, в смысле, полученных на том же сканере.

С миру по нитке, потому сканы разные.
Наверх
 
 
IP записан
 
AlVaKo
Гуру
****
Вне Форума



Сообщений: 576
Алма-Ата
Пол: male
Re: Требуется помощь в обработке
Ответ #7 - 01.11.2011 :: 07:51:30
 
2 папаВлад

Посмотрите, может подойдет. Размер 170 кБ. У страницы размер по ширине и высоте увеличил на 1 пиксел.  Портреты сделаны в 100 dpi.

http://files.mail.ru/0WZJMN ;  

Или Размер 110 кБ.  Портреты в 75 dpi.

http://files.mail.ru/JJZLW0
Наверх
« Последняя редакция: 01.11.2011 :: 08:02:27 от AlVaKo »  

Сложно отбинаризировать черную перемычку на белой бумаге, особенно если её там нет.
 
IP записан
 
папаВлад
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 100
Подмосковье
Пол: male
Re: Требуется помощь в обработке
Ответ #8 - 01.11.2011 :: 10:43:28
 
AlVaKo, пойти-то пойдёт конечно, но меня научить нужно, у меня таких страниц десятки Улыбка
Спасибо!
Наверх
 
 
IP записан
 
AlVaKo
Гуру
****
Вне Форума



Сообщений: 576
Алма-Ата
Пол: male
Re: Требуется помощь в обработке
Ответ #9 - 01.11.2011 :: 11:37:00
 
Один из вариантов, освоить DjVu Imager и метод разделенных сканов.
Размывать картинки не понадобиться.

почитате это.

http://www.djvu-soft.narod.ru/scan/djvu_imager.htm
Наверх
 

Сложно отбинаризировать черную перемычку на белой бумаге, особенно если её там нет.
 
IP записан
 
папаВлад
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 100
Подмосковье
Пол: male
Re: Требуется помощь в обработке
Ответ #10 - 01.11.2011 :: 22:46:21
 
Почитал. Очень замудрённо, я никогда такое не освою.

Решил оставить всё как есть. Всё-равно, кто-нибудь когда-нибудь будет пересканировать эти журналы, и наверняка сделает грамотно, а пока, для ознакомления, будет достаточен и такой вариант.
Наверх
 
 
IP записан
 
Kis
Активист
***
Вне Форума



Сообщений: 434
Россия, Москва
Пол: male
Re: Требуется помощь в обработке
Ответ #11 - 01.11.2011 :: 23:26:04
 
Вот на пробу два бинаризованных портрета: http://www.onlinedisk.ru/file/762159/ (остальных было лень делать).
Правда, мне не очень нравится, но это сделано на скорую руку, поэтому наверяка можно поаккуратнее подобрать профиль обработки и получить более точную передачу как очень густых, так и очень разреженных черных точек.
Из плюсов: на портрете подполковника Полторацкого хоть что-то видно в центре георгиевского креста. Из минусов: весьма неряшливые самые светлые и самые темные места.
Возможно, после некоторых экспериментов я соглашусь, что лучше эти портреты не бинаризовать, а размыть. Но 100 dpi -- это, IMHO, профанация, годящаяся для некоторых других сайтов, но не для этого.
Наверх
« Последняя редакция: 01.11.2011 :: 23:32:13 от Kis »  
 
IP записан
 
AlVaKo
Гуру
****
Вне Форума



Сообщений: 576
Алма-Ата
Пол: male
Re: Требуется помощь в обработке
Ответ #12 - 02.11.2011 :: 12:09:02
 
Если линеатура полиграфического растра около 100 dpi, то делать иллюстрации с бОльшим разрешением особого смысла нет. Бесполезное увеличение объема файла. Получение муара и героическая борьба с ним. Хотя не исключаю, может кому-то и нравиться муар на экране.
Наверх
 

Сложно отбинаризировать черную перемычку на белой бумаге, особенно если её там нет.
 
IP записан
 
Kis
Активист
***
Вне Форума



Сообщений: 434
Россия, Москва
Пол: male
Re: Требуется помощь в обработке
Ответ #13 - 02.11.2011 :: 13:49:08
 
Исходнтк-то на 300 dpi. Или это перевранное разрешение?
Наверх
 
 
IP записан
 
AlVaKo
Гуру
****
Вне Форума



Сообщений: 576
Алма-Ата
Пол: male
Re: Требуется помощь в обработке
Ответ #14 - 02.11.2011 :: 18:52:48
 
Не совсем так. Исходником будем считать бумажный лист журнала. На котором существует два типа информации. 1-й тип это текст, информация о нем пока ещё "аналогово-непрерывная". 2-й тип это иллюстрации выполненые растром точек, и вот эта информация уже "дискретная" с примерной плотностью 100dpi.  После сканирования в 300dpi, о такой плотности можно говорить только в отношении текста. А в отношении иллюстраций можно сказать только о кривом ресэмпленге, т. к. сетка полиграфического растра совсем не синхронизирована с сеткой сканера. Но ресэмплинг вверх до 300dpi информации не добавляет. Информация иллюстраций как содержалась в комбинации  из максимум 100 точек/на дюйм, так в этих 100 точках и осталась. Остальные 200 точек, так, "клоны" интерполирования.
Наверх
 

Сложно отбинаризировать черную перемычку на белой бумаге, особенно если её там нет.
 
IP записан
 
Kis
Активист
***
Вне Форума



Сообщений: 434
Россия, Москва
Пол: male
Re: Требуется помощь в обработке
Ответ #15 - 02.11.2011 :: 23:21:52
 
Не согласен. Иллюстрации с растром примерно на 100 dpi -- это только шаг точек растра. Информацию также содержит диаметр этих точек. Наверное, правильным было бы создание специального электронного формата картинок, который содержал бы информацию о сетке точек (прямоугольной, шестиугольной или какой-нибудь еще, а также об угле наклона некой базовой линии сетки к сторонам бумажного листа) и о диаметре каждой из точек растра. При кодировании обычного (с квадратными пикселами) скана в 100 dpi мы либо теряем информацию о диаметре точек, либо получаем лишь ее отображение в градации серого цвета, причем совсем не факт, что обратимое отображение. При помощи сканера эту информацию можно более-менее точно получить лишь сканированием с высоким разрешением (не уверен даже, что тут 600 dpi во всех случаях хватит) с целью передачи каждой отдельно взятой точки растра группой из нескольких десятков пикселей.
Наверх
 
 
IP записан
 
GMAP
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 52
Somewhere there...
Пол: male
Re: Требуется помощь в обработке
Ответ #16 - 03.11.2011 :: 09:22:54
 
папаВлад писал(а) 01.11.2011 :: 22:46:21:
Очень замудрённо

Поглядите на такой вариант - http://rghost.ru/28330171
Только автомат, никакой ручной обработки. Несколько не традиционный способ, зато нет нужды что-то изучать, все софты стандартные.
Наверх
 
 
IP записан
 
AlVaKo
Гуру
****
Вне Форума



Сообщений: 576
Алма-Ата
Пол: male
Re: Требуется помощь в обработке
Ответ #17 - 03.11.2011 :: 09:58:08
 
Kis писал(а) 02.11.2011 :: 23:21:52:
... При кодировании обычного (с квадратными пикселами) скана в 100 dpi мы либо теряем информацию о диаметре точек, либо получаем лишь ее отображение в градации серого цвета, причем совсем не факт, что обратимое отображение. При помощи сканера эту информацию можно более-менее точно получить лишь сканированием с высоким разрешением (не уверен даже, что тут 600 dpi во всех случаях хватит) с целью передачи каждой отдельно взятой точки растра группой из нескольких десятков пикселей.


Ну да, диаметр точки содержит 3-меру измерения для картинки, это оттенок. И сканирование в 300dpi (100dpi-шного растра) можно с натяжкой трактовать как дисретизацию глубины оттенка. Мы теряем точную информацию о диаметре и получаем 3*3=9 градаций для описания площади(оттенка).  И обратной дороги нет. Ситуация на самом деле не столь плачевна, у современных сканеров линейка датчиков имеет плотность не менее 1200dpi. Тогда получаем 3*12=36 оттенков(можно жить). Еще краевые эффекты добавят число уровней. Вот и получаем чтобы более-менее верно судить об оттенке 300dpi-шного скана, нам надо суммировать окрестность из точек 3*3, а это приводит к понижению линейного разрешения до 100dpi.   

Получается в отношении двух первых измерений , распределения точек по плоскости имеем дискретную информацию по плоскости с ресэмпленгом вверх. В отношении 3-й меры - оттенка, изначально имели "аналоговую информацию" которую подвергли дисретизации по уровню. И сканировать 100dpi-шный растр в 600dpi и выше, совсем не лишено смысла, ради
передачи всех оттенков картинки.
Наверх
« Последняя редакция: 03.11.2011 :: 11:57:11 от AlVaKo »  

Сложно отбинаризировать черную перемычку на белой бумаге, особенно если её там нет.
 
IP записан
 
AlVaKo
Гуру
****
Вне Форума



Сообщений: 576
Алма-Ата
Пол: male
Re: Требуется помощь в обработке
Ответ #18 - 03.11.2011 :: 10:08:07
 
GMAP писал(а) 03.11.2011 :: 09:22:54:
Поглядите на такой вариант - http://rghost.ru/28330171
Только автомат, никакой ручной обработки. Несколько не традиционный способ, зато нет нужды что-то изучать, все софты стандартные.

А поподробнее можно? О способе.
Наверх
 

Сложно отбинаризировать черную перемычку на белой бумаге, особенно если её там нет.
 
IP записан
 
GMAP
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 52
Somewhere there...
Пол: male
Re: Требуется помощь в обработке
Ответ #19 - 03.11.2011 :: 16:16:44
 
IrfanView - jpg оттенки серого
Acrobar 10.1 - ClearScan
GhostView - pdf > pdf, иначе PDF2DJVU не поймет
PDF2DJVU
После Акробата не бывает трупных пятен на картинках плюс текст приводится в относительный порядок и даже с OCR. Про дореволюционную орфографию речь не идет.
Наверх
 
 
IP записан
 
папаВлад
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 100
Подмосковье
Пол: male
Re: Требуется помощь в обработке
Ответ #20 - 03.11.2011 :: 19:41:16
 
GMAP, ничего не получилось. Объясняете вы, конечно, не ахти как понятно, но я пытался...
"""IrfanView - jpg оттенки серого""" - мне не нужно переводить в серый, ну да ладно, для эксперимента попробовал и цветной и серый варианты.
"""Acrobar 10.1 - ClearScan""" - эта версия Акробата весит более 600 Мб, качается уже часа 3, осталось 7 часов, нашёл полегче девятую версию, установил, не могу найти ClearScan, спасла эта страница http://acrobatusers.com/print/2215 , оказывается это при распознавании нужно такую опцию включать. Окей, сделал, сохраняю как jpg, сжимаю в djvu, чуть получше стало (результат выдрал из djvu http://s017.radikal.ru/i401/1111/3f/f3109917fc14.jpg ), но не как у вас. Ну, думаю, надо идти до конца, в Акробате сохраняю в pdf, ищу GhostView, все ссылки ведут на GSview 4.9, скачиваю отсюда http://pages.cs.wisc.edu/~ghost/gsview/get49.htm , установил, запустил, при добавлении файла pdf зависает, потом надпись об ошибке:
""" GSview 4.9 2007-11-18
Failed to load C:\Program Files\GSLITE\gsdll32.dll, error 126
Не найден указанный модуль.
Failed to load C:\Program Files\Ghostgum\gsview\gsdll32.dll, error 126
Не найден указанный модуль.
Failed to load gsdll32.dll, error 126
Не найден указанный модуль.
Can't load Ghostscript DLL """

Всё, тупик.
PDF2DJVU не искал, т.к. не дошёл до этого пункта.

GMAP, если знаете, то напишите где, в каком месте должен исчезнуть тот "паразитный" слой на картинке, который оставляет следы в djvu. Быть может можно найти альтернативные программы. Мне кажется, что ClearScan тут ничего не решает, возможно в каком-то другом месте, например при конвертации из одного формата в другой.
Наверх
 
 
IP записан
 
GMAP
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 52
Somewhere there...
Пол: male
Re: Требуется помощь в обработке
Ответ #21 - 05.11.2011 :: 06:43:08
 
папаВлад писал(а) 03.11.2011 :: 19:41:16:
"IrfanView - jpg оттенки серого" - мне не нужно переводить в серый, ну да ладно, для эксперимента попробовал и цветной и серый варианты.

Я и не говорю, что серый должен быть всегда, но для той странички с портретами - однозначно, там нет цвета. 
папаВлад писал(а) 03.11.2011 :: 19:41:16:
"Acrobar 10.1 - ClearScan" - эта версия Акробата весит более 600 Мб

Вы просто не в курсе, что есть перепакованные дистрибутивы меньшего размера. Надо было просто сказать про проблемы с закачкой, я бы выложил более компактный вариант.
папаВлад писал(а) 03.11.2011 :: 19:41:16:
Окей, сделал, сохраняю как jpg

Так делать нельзя, выходной файл должен быть в pdf.
папаВлад писал(а) 03.11.2011 :: 19:41:16:
Всё, тупик.

Никакого тупика, наоборот, все только начинается. Просто я не мог предположить, что у Вас нет в наличии необходимого софта. Напишите мне в личку, выложу весь необходимый софт, только укажите какая ОСь и на какой обменник выложить.
папаВлад писал(а) 03.11.2011 :: 19:41:16:
Быть может можно найти альтернативные программы. Мне кажется, что ClearScan тут ничего не решает, возможно в каком-то другом месте, например при конвертации из одного формата в другой.

Альтернативы может и есть, но я ими не пользуюсь. Пока что указнные программы справляются со своими задачами. ClearScan выбран не просто так, а за вполне конкретные фичи, которых в других софтах нет.
С другой стороны, я не навязываю свои взгляды на обработку, если Вы считаете что можно получить аналогичный результат другими способами, то никаких возражений у меня нет.
Наверх
 
 
IP записан
 
папаВлад
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 100
Подмосковье
Пол: male
Re: Требуется помощь в обработке
Ответ #22 - 07.11.2011 :: 19:50:16
 
GMAP, спасибо за поддержку.
Тормознул я пока Ниву, попозже буду с ней возиться, хочу пересканить свою подшивку.
Если никак не справлюсь с чужими сканами, то попрошу подробностей.
Наверх
 
 
IP записан
 
Переключение на Главную Страницу Страниц: 1
Послать Тему Печать