OCR форумы Добро пожаловать, Гость. Пожалуйста, выберите Вход или Регистрация
Всем привет!
Hi all!
 
  ГлавнаяСправкаПоискВходРегистрация Администратор Библиотека  
 
Страниц: 1 2 3 4 
Послать Тему Печать
Сканирование газет (Прочитано 82511 раз)
Владислав_72
Активист
***
Вне Форума



Сообщений: 337
Москва
Пол: male
Re: Сканирование газет
Ответ #30 - 28.04.2012 :: 21:54:58
 
Цитата:
Хоть убейте не пойму, что дает 300 dpi gray -> 600 dpi gray кроме жуткого увеличения размера.

Ваш вопрос изначально имел смысл - "зачем сканить в 600дпи" (по крайней мере я понял его так), соответственно я его, надеюсь, немного прояснил ... а сейчас вы трактуете его уже немного по-другому, и уже действительно 300дпи грей в 600дпи грей перегонять почти не имеет смысла, реального качества не прибавишь, хотя обрабатывать будет не проще, но возможно меньше ошибок будет при распознавании ...
Наверх
 
 
IP записан
 
GMAP
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 52
Somewhere there...
Пол: male
Re: Сканирование газет
Ответ #31 - 29.04.2012 :: 06:35:33
 
папаВлад писал(а) 27.04.2012 :: 22:04:32:
важнее качество, которое у всех оценивается по-разному

Я бы очень хотел посмотреть на 1 (один) лист газеты с качеством, которое Вас устраивает. Чисто из любопытства, для пополнения знаний о смысле сохранения в сером, не говоря уже о цветном, поскольку до сих пор считал что в газетах, в основном, одна краска - черная. Может выложите пример, даже без склейки?
Наверх
 
 
IP записан
 
bolega
Патриарх
*****
Вне Форума



Сообщений: 1104
Re: Сканирование газет
Ответ #32 - 29.04.2012 :: 16:03:19
 
Владислав_72 писал(а) 28.04.2012 :: 21:54:58:
Ваш вопрос изначально имел смысл - "зачем сканить в 600дпи"

Нет, не надо фантазировать. Мой вопрос был навеян этим:
папаВлад писал(а) 27.04.2012 :: 22:04:32:
Сканы 300, после обработки и перед сжатием в djvu, увеличиваю в размерах на 200% и до 600 DPI, т.е. я всё-равно сжимаю шестисотые, так чего бы не попробовать взять изначально такой размер.


Кстати, против сканирования в 600dpi gray ничего не имею, но есть сомнение в необходимости этого для газет. Я никогда не встречал книг в djvu 600dpi gray, а тут газеты.. Впрочем, возможно, я не прав.
Наверх
 
 
IP записан
 
папаВлад
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 100
Подмосковье
Пол: male
Re: Сканирование газет
Ответ #33 - 29.04.2012 :: 20:00:41
 
Блин, да чтож за недопонимание-то? Почему 600, почему в цвете, почему не нравится так??? А вот просто, не нравится!!! А вот так случилось, что уже посканил на 600, да в цвете! И вот, что мне с этим добром/дерьмом теперь делать, не понятно.

Я хочу научиться нормально оцифровывать газеты А2/А3, хочу с каждым номером делать лучше, чем прежние. Я делаю шаги туда/сюда: пробую сканы на 600, вместо 300, т.к. мелкий плохопропечатанный шрифт при сжатии теряется, научился правильно избавляться от постороннего цвета (жёлто-рыжий), тыкаюсь в разные непонятные программы, читаю советы/ответы, что-то осваиваю, что-то отбрасываю. При этом, не стесняясь, делюсь с вами своим маленьким опытом, высказываю своё мнение (которое на данный момент), но не навязываю его никому и не прошу его считать за эталон.

Газеты бывают и цветные, даже ежедневная советская периодика на праздники выходила с цветными шрифтами/рамками/цветочками, а современные газеты практически все цветные. Пример от Lukasa по его ссылке http://www.onlinedisk.ru/view/864768 Вот потому нужны цветные сканы и сохранять их нужно в цвете. А те, которые изначально ч/б, то на любом этапе обработки не сложно перевести в серый или ч/б, кому как привычнее, да и учитывая, есть ли на странице фотки.

Да, мне не нравится сжатие битонал (эти агрессивно-контрастные буквы), но это не значит, что я совсем против него, пусть каждый для себя сам решит как сжимать. У вас многолетний опыт, вы и из мусора конфетку в битонале сделаете и вам не страшны тонкие буквы. Я тоже несколько журналов сделал в ч/б (не сером), которые мне понравились (речь о Человек и закон), но это был чёткий толстый шрифт и я был уверен, что никакая Т не превратится в Г и запятая не станет точкой. Но опять же, в душе, я бы всё-таки предпочёл сохранить в сером, для собственного спокойствия.

Мои газеты тут http://papavlad.ucoz.ru/load/gazety/7 и хоть они страшные, мне не стыдно их опубликовывать, они сделаны настолько качественно, насколько позволяет мне свободное время и опыт.

-
Вернусь в Scan Tailor.
Опытным путём установил, что максимально принимает 11800 пикселей по большей стороне, 11900 уже не вставляет в проект, DPI тут роли не играет, пробовал и 300 и 600. Но, после обработки в СТ, файл на выводе не получается сохранить, обычно программа просто вылетает или сохраняет лишь белый или чёрный лист.
Буду пробовать ещё уменьшать размеры исходных картинок.
Наверх
 
 
IP записан
 
Владислав_72
Активист
***
Вне Форума



Сообщений: 337
Москва
Пол: male
Re: Сканирование газет
Ответ #34 - 29.04.2012 :: 21:08:48
 
Цитата:
Я никогда не встречал книг в djvu 600dpi gray, а тут газеты..
А вот я почему-то встречал, может и не так часто, но встречал. Для газет правда не встречал ...

Цитата:
Блин, да чтож за недопонимание-то? Почему 600, почему в цвете, почему не нравится так???
Я вас прекрасно понимаю и полностью на вашей стороне, поскольку сам сканирую исключительно на 600 точек и меня не удовлетворяют многие книги, оцифрованные на 300дпи, даже если они прошли через скантейлор с апсамплингом 300->600дпи ...
Вот сейчас при оцифровке журнала попалась цветная вкладка-карта размером 360х480 (почти А2), и я проверил склейку ее 600дпи кусков в фотошопе 5.5 и Scan&Stitch - оба справились, результаты примерно одинаковые как по времени, так и по качеству, но последний требует примерно одинаковых размеров кусков и дополнительно ряд лишних сканов по центру, т.е. для А2 нужно не 4 скана А4 с перекрытиями, а 6 сканов. И сам еще подсказку при запуске склейки дает, как клеить - линейкой или таблицей.

Цитата:
Буду пробовать ещё уменьшать размеры исходных картинок.
Не надо, не портите качество скантейлором - "потомки вам не простят" ...
Наверх
« Последняя редакция: 29.04.2012 :: 21:23:26 от Владислав_72 »  
 
IP записан
 
папаВлад
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 100
Подмосковье
Пол: male
Re: Сканирование газет
Ответ #35 - 29.04.2012 :: 22:50:49
 
Владислав_72 писал(а) 28.04.2012 :: 17:55:08:
Мне результат работы скантейлора не особо нравится, ... он все равно автоматом портит шрифты на сканах, выравнивая порог черного ...

Это вы про то, когда на Вывод выбрать режим Черно-белый или Смешанный?
Ну, я так понимаю, что это любой способ будет уничтожать светлые края шрифта, независимо от того, как обрабатывать страницу, хоть через СК или СТ, хоть через графический редактор, хоть с помощью программ по сжатию. Иначе придёться оставлять фон с паразитным слоем.
Или при Выводе в Цветном/сером тоже портится? По идее, в цветном/сером ничего не должно изменятся.
В любом случае, меня СТ устраивает.

-
Про Scan Tailor заметил недавно вот что. На выходе в цветном режиме белые поля не совсем белые, там присутствует какой-то оттенок. Заметить его сложно, точнее я его вижу только на ноутбуке под определённым углом наклона. То есть, если я белой кисточкой проведу по полю, то виден более светлый след. Не знаю, насколько это важно, т.к. после всё-равно обрабатываю сканы и осветляю фон.
Да, и замечу, что не проверял, если на вывод выбрать черно-белый или смешанный режим, может при таких вариантах всё белое-белое.
Наверх
 
 
IP записан
 
Владислав_72
Активист
***
Вне Форума



Сообщений: 337
Москва
Пол: male
Re: Сканирование газет
Ответ #36 - 30.04.2012 :: 08:55:30
 
Цитата:
Ну, я так понимаю, что это любой способ будет уничтожать светлые края шрифта, независимо от того, как обрабатывать страницу, хоть через СК или СТ, хоть через графический редактор, хоть с помощью программ по сжатию

Нет, не любой, в случае частичных непропечаток символов определенные редакторы не будут заливать черным весь символ при бинаризации, и светлые места будут просто более разреженными черными точками, что сохранит эффект типографской печати. СТ же поступает не так, он похоже (может и ошибаюсь, пость гуру по нему проконсультируют) подбирает символы из встроенных его шрифтов и в итоге удаляет указанный эффект, шрифты становятся жирными и похожими на компьютерные, причем утоньшение шрифтов действует плохо, перво-наперво начинают исчезать перемычки в символах (проблема инь-янь).
Но в других редакторах бинаризацию приходится делать постранично, что сильно утомляет, можно было бы автоматом над группой сканов в фотошопе, но мне не нравятся там варианты бинаризации, которые он предлагает, возможно есть другие варианты, но я не сильный знаток фотошопа.
Наверх
« Последняя редакция: 30.04.2012 :: 17:14:03 от Владислав_72 »  
 
IP записан
 
GMAP
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 52
Somewhere there...
Пол: male
Re: Сканирование газет
Ответ #37 - 30.04.2012 :: 11:23:36
 
папаВлад писал(а) 29.04.2012 :: 20:00:41:
Я хочу научиться нормально оцифровывать газеты А2/А3, хочу с каждым номером делать лучше, чем прежние.

Мне кажется, что Вы не столько хотите научиться, сколько продемонстрировать свои предпочтения, даже если они противоречат здравому смыслу. Если газета черно-белая изначально, то сканировать ее в цвете нерационально, кроме безумного увеличения размера, это ничего не даст. Но Вы же скажете - а мне так нравится! Это никто не оспаривает, но зачем тогда говорить про некое обучение?
папаВлад писал(а) 29.04.2012 :: 20:00:41:
Пример от Lukasa по его ссылке http://www.onlinedisk.ru/view/864768

То же самое в три раза меньше, лучше и это не предел для jpg: http://www.onlinedisk.ru/edit_image/869598/
Наверх
 
 
IP записан
 
папаВлад
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 100
Подмосковье
Пол: male
Re: Сканирование газет
Ответ #38 - 01.05.2012 :: 01:09:14
 
Мой здравый смысл подсказывает, что пора закончить это обучение.
Всем спасибо.
Наверх
 
 
IP записан
 
slava_kry
Гуру
****
Вне Форума



Сообщений: 551
Re: Сканирование газет
Ответ #39 - 01.05.2012 :: 15:40:31
 
Вам небольшая подсказка по удалению жёлтого фона с малоцветных газет и разделению по цветам. Весь жёлтый будет в канале Yellow, а чёрный в Black.
http://youtu.be/0b3aabNJD9w?hd=1 - первые 35 секунд.

И ИМХО сначала вам нужно определиться с задачей, иначе непонятно чего вы хотите добиться. Прекрасного качества и маленького размера одновременно добиться не получится из-за качества самого оригинала и его ДД (динамического диапазона). Это получится только в одном случае - если вы будете иметь доступ к электронным оригиналам.  Улыбка
Наверх
 

Он сказал им: вы выказываете себя праведниками пред людьми, но Бог знает сердца ваши, ибо что высоко у людей, то мерзость пред Богом.
 
IP записан
 
папаВлад
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 100
Подмосковье
Пол: male
Re: Сканирование газет
Ответ #40 - 02.05.2012 :: 23:32:16
 
slava_kry, похоже это фотошоп, к сожалению не пользуюсь им. Осваивать с нуля будет сложно.
Смысл я уловил, это как бы разложить по слоям и удалить слой с жёлтым. Но это поможет удалить только ровный фоновый слой, а вот где складки на старой газете, там цвет меняется в коричневый, и удаляя коричневу теряется много нужного шрифта. Наверное, фотошоп может и со складками справиться, но это будет серьёзная потеря времени. Для меня проще их оставить в цвете, так чёрные буквы на коричневом фоне можно как-то прочитать, а в сером всё сливается и не читается. Вообще, надо бы на досуге, ещё что-то почитать про удаление желтизны, но без фотошопа, а то мои методы не всегда спасают.

Прекрасного качества мне не нужно, лишь бы сохранить то, что видно в скане. Размеры вообще никак не волнуют, просто сжимаю потом разными способами, получается 2-3 файла разного размера, пусть выбирают кому-что. Коллекционеры берут те, что крупнее, библиотеки - поменьше, копипастеры - средние, вобщем всё востребовано.

-
Ранее была проблема с обработкой картинок высотой от 13000 пикселей, ну так убавил в 2 раза, и далее всё по старой схеме.
Владислав_72, особо не переживай, ну не смог никак с большими, а так легко. Всё читается  Подмигивание
Наверх
 
 
IP записан
 
Владислав_72
Активист
***
Вне Форума



Сообщений: 337
Москва
Пол: male
Re: Сканирование газет
Ответ #41 - 11.05.2012 :: 10:45:18
 
На последок еще чуть нюанса по склейке разворотов -
все-таки Scan&Stitch иногда неточно склеивает (расхождение в доли градуса, что иногда чревато для схем), фотошоп (в случае 3х сканов разворота) клеит качественнее, но оказалось, что первая программа не трогает формат файла, а вот фотошоп - всегда конвертирует куски и саму итоговую склейку в 24битный труколор (я давно заметил, что с монохромом ФШ работать не хочет и не умеет).
И по времени в случае монохромных разворотов выходит она быстрее, чем ФШ.
И насчет Скантейлора - почему мне он не нравится - он все равно при выводе в черно-белый бинаризирует даже изначально монохромные сканы, причем по своему, уничтожая изначальные части букв и утолщая несуществующие части, искажая таким образом текст. Я бы понял, если бы он пропускал такие страницы, однако нет.
Вот пример:
исходный монохромный скан:
...
заново бинаризованный скантейлором:
...
Буквы "рубятся" по краям, и становятся похожи на компьютерные (настройки СТ дефолтные), что на мой взгляд почти уничтожает "душевность" старых книжных шрифтов. Многим это вполне на уровне, а вот мне - нет.
Наверх
« Последняя редакция: 11.05.2012 :: 11:04:27 от Владислав_72 »  
 
IP записан
 
Alex2013
Новичок
*
Вне Форума


Всем привет!

Сообщений: 15
Re: Сканирование газет
Ответ #42 - 08.10.2013 :: 10:15:13
 
C чего начать?

Имеется большой архив газет конца 80 - начала 90 гг. политической направленности. В Сети, если судить по моим поискам, большинства из них нет.
Хочу: отсканировать издания, распознать и выложить в Интернет для открытого доступа.
Возможности: опыта сканирования нет, сканера нет, фотоаппарата нет. Есть время и немного денег.
Склоняюсь к тому, чтобы купить недорогой фотик где-то за 2-4 тыс руб. и им работать.
Нужны советы:
1. Реально ли использовать фотоаппарат для целей сканирования? Какая модель предпочтительнее?
2. Желательной количество мегаписелей?
3. Какую использовать программу OCR? Хотелось бы бесплатную по WinXP.
Пока вопросы все. Но обязательно будут еще Улыбка
Наверх
 
 
IP записан
 
slava_kry
Гуру
****
Вне Форума



Сообщений: 551
Re: Сканирование газет
Ответ #43 - 08.10.2013 :: 17:29:19
 
@
Alex2013
Бюджет ни в какие ворота...
Можно купить б/у сканер. Фотик за такие деньги брать нет смысла.
Потом, вероятней всего, вас задолбает сканить кусками (~2-3 скана для страницы А3 (стандарт для газет) на сканере А4), а потом сшивать и вы быстро "сдуетесь", а делать одним снимком нужен свет, крепление а-ля штатив и фотик хотя бы на 15-18 МП, также очень желательно управление фотиком с компа.
Такие дела...
Наверх
 

Он сказал им: вы выказываете себя праведниками пред людьми, но Бог знает сердца ваши, ибо что высоко у людей, то мерзость пред Богом.
 
IP записан
 
Dmitry7
Модератор
*****
Вне Форума


Соберем Серии "НВЖНиТ"!

Сообщений: 5871
Санкт-Петербург
Пол: male
Re: Сканирование газет
Ответ #44 - 08.10.2013 :: 20:03:28
 
slava_kry писал(а) 08.10.2013 :: 17:29:19:
@
Alex2013
Бюджет ни в какие ворота...
Можно купить б/у сканер. Фотик за такие деньги брать нет смысла.
Потом, вероятней всего, вас задолбает сканить кусками (~2-3 скана для страницы А3 (стандарт для газет) на сканере А4), а потом сшивать и вы быстро "сдуетесь", а делать одним снимком нужен свет, крепление а-ля штатив и фотик хотя бы на 15-18 МП, также очень желательно управление фотиком с компа.
Такие дела...

а сколько стоит б/у сканер А3 ? может ему такой купить лучше?
Наверх
 

"Если хочешь сделать что-то хорошо, сделай это сам!"
332371574  
IP записан
 
Dmitry7
Модератор
*****
Вне Форума


Соберем Серии "НВЖНиТ"!

Сообщений: 5871
Санкт-Петербург
Пол: male
Re: Сканирование газет
Ответ #45 - 08.10.2013 :: 20:06:17
 
Alex2013 писал(а) 08.10.2013 :: 10:15:13:
C чего начать?
Хочу: отсканировать издания, распознать и выложить в Интернет для открытого доступа.

На распознавание время бы не тратили. кому нужно, сделает себе сам (или Вы после сканирования и переделки в djvu|pdf основной массы). А читать газеты можно и нераспознанные.
Старые газеты ценны факсимильностью!
мое мнение.
Наверх
 

"Если хочешь сделать что-то хорошо, сделай это сам!"
332371574  
IP записан
 
slava_kry
Гуру
****
Вне Форума



Сообщений: 551
Re: Сканирование газет
Ответ #46 - 08.10.2013 :: 20:27:49
 
А3 сканеры сами по себе редкость в частных руках, а уж на продажу найти ещё сложнее Улыбка ИМХО.
Есть дешёвый Mustek, но там вроде бы какие-то траблы и CIS линейка странная, со слов пользователей, то полосит, то нет. А больше я не слышал о дешёвых А3 сканерах.
Наверх
 

Он сказал им: вы выказываете себя праведниками пред людьми, но Бог знает сердца ваши, ибо что высоко у людей, то мерзость пред Богом.
 
IP записан
 
AAW
Патриарх
*****
На Форуме


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5431
Екатеринбург
Пол: male
Re: Сканирование газет
Ответ #47 - 08.10.2013 :: 21:02:01
 
да, количество денег не соответствует задаче. Газеты - это не НПС. И шрифт мельче, и формат огромный.

Почти оффтоп:
в подобных случаях несоответствия вспоминаю вот эту картинку:
http://demotivators.to/p/525625/pamyatka-zakazchiku.htm
и вздыхаю.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
Alex2013
Новичок
*
Вне Форума


Всем привет!

Сообщений: 15
Re: Сканирование газет
Ответ #48 - 09.10.2013 :: 11:13:58
 
Спасибо всем откликнувшимся.
Позволю себе высказать следующие соображения:
1. О сканере. За предложенную сумму можно купить не только новый средненький сканнер, но и МФУ. Конечно А4. А3 в продаже просто не видел. Его размеры и цена могут наверное испугать даже смелого человека. Улыбка
2. Присмотрел себе 16 мегапиксельный фотик Canon A1400. Стоит 2500 руб. Из дешевой категории Canon по отзывам потребителей самые лучшие. У меня была мыльница Кодак - очень сильно пережимал JPG.
3. Почему хочу не просто отсканировать, но и распознать? Смысл в том, чтобы поисковые машины могли проиндексировать содержание газет со всеми вытекающими из этого последствиями для ищущих информацию.
4. Сейчас задумался об авторском праве. Некоторых газет уже нет в природе, другие пока существуют. Они меня за одно место не возьмут?
5. Предполагается следующий алгоритм действий:
фотографирование листа газеты, перевод его в PDF, склейка всех листов  в один файл. На каком этапе распознавать текст и главное - чем? Где-то валяется диск с древним FineReader, не совсем легальным Плачущий Кто что думает о бесплатной CuneiForm?
6. Можно задать вопрос - почему PDF, а не Ди-ви-джи? С
PDF я работал, более-менее его знаю, а Ди-ви-джи только читал. Да и на некоторых планшетах он по-моему "не идет". Хотя размер у него вроде меньше?
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
На Форуме


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5431
Екатеринбург
Пол: male
Re: Сканирование газет
Ответ #49 - 09.10.2013 :: 12:16:54
 
Alex2013 писал(а) 09.10.2013 :: 11:13:58:
Они меня за одно место не возьмут?

формально - могут.
Волков бояться - в лес не ходить.

Насчёт дешёвых фотоаппаратов: проверьте качество получаемого jpeg. Буковки могут быть неразборчивыми после сжатия.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
Kis
Активист
***
Вне Форума



Сообщений: 430
Россия, Москва
Пол: male
Re: Сканирование газет
Ответ #50 - 09.10.2013 :: 12:23:00
 
@
Alex2013
1. Вам в первом же посте ответили про сканер, а не про фотоаппарат. За 3 тысячи можно купить не только б/у, но и вполне нормальный новый сканер А4. А смелого человека вообще ничто не пугает. Такой человек не боится, а лишь опасается. Я вот, например, опасаюсь дилетантов с фотоаппаратами, которые хотят копировать литературу. Потому что в таких случаях почти всегда получается дрянь.
2. Имхо, качество оптики гораздо важнее. В фотоаппарате за 2500 рублей оптика наверняка отвратительная.
3. Тогда вам не сюда. Подавляющее большинство постоянных участников этого форума предпочитают факсимиле. А распознанный текст служит приятным, но не обязательным дополнением.
4. Возьмут, но не сразу. Главное, не пишите правообладателям о том, что вы собираетесь нарушать их права. А то некоторые умудряются именно так и поступать. Кстати, если газеты уже нет, это ещё не значит, что и правообладателя тоже нет. Полно всяких организаций типа АльфаБетаГамма-Груп или ХХХ-Банк, которые напокупали всяких активов и теперь сидят на них, не зная, что с ними делать.
5. CuneiForm — бесплатная низкокачественная дрянь.
6. Нет такого понятия: "Ди-ви-джи". Если уж о чём-то пишете и просите серьёзного совета, потрудитесь хотя бы изучить термины. К тому же тут полно тех, кто очень уважает формат djvu. Чем отличаются pdf и djvu и чем они схожи — информации полно, в том числе и на этом сайте. Повторять ещё раз — выглядит метанием бисера.
Наверх
 
 
IP записан
 
slava_kry
Гуру
****
Вне Форума



Сообщений: 551
Re: Сканирование газет
Ответ #51 - 09.10.2013 :: 12:54:25
 
Alex2013
У меня были в пользовании сканеры А3 разного класса, ничего пугающего Улыбка

Цитата:
Присмотрел себе 16 мегапиксельный фотик Canon A1400. Стоит 2500 руб.

Фотик плох для А3 (мягко выражаясь), даже по меркам мыльниц Улыбка Предстоит нехилая обработка... Вы готовы? Улыбка
ISO 100
http://i2.rozetka.ua/goods/9768/canon_a1400_black_9768771.jpg
http://i3.rozetka.ua/goods/9768/canon_a1400_black_9768913.jpg
http://www.nix.ru/art/pic/samples/sp1366439955.jpg
А по сути...
Пробуйте, ваше право, ваши газеты. Улыбка Когда начнёте, выложите пару получившихся оригиналов.
Встаёт вопрос освещения, чем оно будет равномерней и достаточным, тем меньше последующей обработки.
И главный вопрос-то как раз обработка получившегося. Чем лучше обработаете, тем меньше будет ошибок на распознавании.

Успехов!

http://www.dkamera.de/testbericht/nikon-coolpix-p330/abbildungsleistung.html
http://www.dkamera.de/media/testberichte/panasonic/lumix-dmc-tz41/5_testaufnahme...
http://www.dkamera.de/media/testberichte/olympus/sp-800-uz/5_testaufnahmen/3_eck...
http://www.dkamera.de/media/testberichte/canon/powershot-sx280-hs/5_testaufnahme...
http://www.dkamera.de/media/testberichte/nikon/coolpix-p330/5_testaufnahmen/3_ec...
Наверх
 

Он сказал им: вы выказываете себя праведниками пред людьми, но Бог знает сердца ваши, ибо что высоко у людей, то мерзость пред Богом.
 
IP записан
 
Alex2013
Новичок
*
Вне Форума


Всем привет!

Сообщений: 15
Re: Сканирование газет
Ответ #52 - 09.10.2013 :: 13:15:43
 
Меня немножко удивила агрессивность старожилов к новичку....Не научился я еще на этом форуме цитировать, поэтому отвечу так:
1-2.  Да, сканер А4 можно купить. Но я достаточно внимательно прочитал этот топик, чтобы понять с какими трудностями я столкнусь: огромные размеры файла, трудности со склейкой нескольких изображений.Просто хочется узнать у тех кто использовал такой метод: хватит ли 16 мегапс. на формат А2 420 x 594 мм. (я несколько ошибся с размером) Плачущий Т.е. на размер листа многих газет. Интересует именно мнение практика, а не теоретика.
3. Факсимиле совсем не сочетается с распознанным текстом?
5. Назвать своего собеседника свиньей - это круто и очень смело. В Интернете...
Википедия пишет, что "DjVu-файл может содержать текстовый (OCR) слой, что позволяет осуществлять полнотекстовый поиск по файлу." Сказать это было выше вашего достоинства?
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
На Форуме


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5431
Екатеринбург
Пол: male
Re: Сканирование газет
Ответ #53 - 09.10.2013 :: 13:35:16
 
Alex2013 писал(а) 09.10.2013 :: 13:15:43:
Меня немножко удивила агрессивность старожилов к новичку...

Подмигивание Возможно, это вам предъявляют цену за пропуск в категорию старожилов. Должны же они чем-то отличаться от новичков кроме наименования и даты первого посещения.
никого не хочу задеть! Очень довольный
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
slava_kry
Гуру
****
Вне Форума



Сообщений: 551
Re: Сканирование газет
Ответ #54 - 09.10.2013 :: 13:50:39
 
@
Alex2013
К вам нет никакой агрессии, если вы её видите, то вы ошибаетесь!
Вы хотите "и рыбку съесть, и рук не замарать". Вам написали желаемое, чтобы осуществить вашу мечту. Где вас назвали "свиньёй" в упор не замечаю, если вы о бисере, то это называется "учите матчасть!" прежде чем формировать требования и просить совета. Улыбка

Теперь о А2. Вот пример фото сделанного Кэнон 7Д (18МП) и макрообъективом Кэнон 60мм газеты формата А2+:
http://img-fotki.yandex.ru/get/5301/krychenkov.4c/0_55cee_130bcced_orig
Тут маленький шрифт, так что на современных газетах будет нормально.

3. Сочетается, но подразумевает сохранение сканированного оригинала прежде всего!
5. Уже выше ответил. По дежавю другие ответят.
Наверх
 

Он сказал им: вы выказываете себя праведниками пред людьми, но Бог знает сердца ваши, ибо что высоко у людей, то мерзость пред Богом.
 
IP записан
 
Kis
Активист
***
Вне Форума



Сообщений: 430
Россия, Москва
Пол: male
Re: Сканирование газет
Ответ #55 - 09.10.2013 :: 15:18:51
 
@
Alex2013
Зато теперь вы сумели правильно написать название формата. И даже залезли в Википедию. А вот без намёков на свиней не удосужились этого сделать.
Наверх
 
 
IP записан
 
joker2156
Активист
***
Вне Форума



Сообщений: 279
Re: Сканирование газет
Ответ #56 - 09.10.2013 :: 22:41:35
 
Alex2013 писал(а) 09.10.2013 :: 13:15:43:
хватит ли 16 мегапс. на формат А2 420 x 594 мм.

Грубо 16 миллионов разделить на произведение 420 x 594 получается примерно 64, 8X8 пикселелей на миллиметр. Переводя в дюймы, получим примерно 200 DPI. При идеальном освещении и на безрыбье жить можно, но плохо. Можно разбивать на два (и более) снимка - получится получше, но опять колбасится со склейкой и т.д. На самом деле все хуже, потому что объективы, особенно недорогие, не могут обеспечить равномерную фокусировку по всему полю, чем ближе к краю, тем больше "мыла". Поэтому если у вас нет профессиональной фотоаппаратуры, недорогой сканер даст существенно (несоизмеримо) лучшие результаты. Программ умеющих склеивать куски - есть, не пробовал для текстов, но с обычными фото замечательно справляется PTGUI, в фотошопе вроде тоже что-то появилось. Вобщем, в рамках условий, на мой взгляд, покупать недорогой фотоаппарат нецелесообразно - и фото будут посредственные, и "фотосканирование" ужасным. Бесполезно потратите деньги, лучше книжек на них купить для самообразования, или пропить с друзьями Улыбка
Наверх
 
 
IP записан
 
slava_kry
Гуру
****
Вне Форума



Сообщений: 551
Re: Сканирование газет
Ответ #57 - 10.10.2013 :: 07:53:06
 
joker2156 писал(а) 09.10.2013 :: 22:41:35:
При идеальном освещении и на безрыбье жить можно, но плохо.

Нормально живётся. Не наводите тень на плетень. Плохо только на плохих оригиналах, там и сканирование не поможет. А с форматами больше чем А4 фактически другого выхода нет, можете у AAW спросить во что ему обошлось сканирование книги "История человечества", которую я до сих пор собираю постранично, при том что ещё обработка не делалась. Улыбка
Просто нужно подходить с головой, а не хотелкой.

При поставленной Alex2013 задачей и озвученным бюджетом, его выбор, на данный момент, это сканер + много терпения + много работы по обработке. Если он увеличит бюджет раза в три-четыре, тогда можно посмотреть в сторону перефотографирования.

Ему же я рекомендую просто взять газету, у кого-нибудь фотик с близкими характеристиками, выйти в яркий день и сфотографировать газету, а потом оценить результат. Это будет самым действенным выбором и непосредственный опыт.

Но похоже человек обиделся Улыбка

Наверх
 

Он сказал им: вы выказываете себя праведниками пред людьми, но Бог знает сердца ваши, ибо что высоко у людей, то мерзость пред Богом.
 
IP записан
 
Alex2013
Новичок
*
Вне Форума


Всем привет!

Сообщений: 15
Re: Сканирование газет
Ответ #58 - 10.10.2013 :: 09:58:51
 
AAW писал(а) 09.10.2013 :: 13:35:16:
Подмигивание Возможно, это вам предъявляют цену за пропуск в категорию старожилов. Должны же они чем-то отличаться от новичков кроме наименования и даты первого посещения.
никого не хочу задеть! Очень довольный


"— Так, что бы вы чухали — кто барабанил полгода, тот молодой, он шестерит черпаку — это кто протянул год, а черпак ходит под дедом, дед разменял полтора года, он уважает дембеля." (с)  Улыбка
Наверх
 
 
IP записан
 
Alex2013
Новичок
*
Вне Форума


Всем привет!

Сообщений: 15
Re: Сканирование газет
Ответ #59 - 10.10.2013 :: 10:08:26
 
Kis писал(а) 09.10.2013 :: 15:18:51:
@
Alex2013
Зато теперь вы сумели правильно написать название формата. И даже залезли в Википедию. А вот без намёков на свиней не удосужились этого сделать.


Басурманским языкам не обучался, но Библию помню:

«Не давайте святыни псам и не мечите бисера вашего перед свиньями, чтобы они не попрали его ногами своими и, обратившись, не растерзали вас».
Матфей (гл. 7, ст. 6)

За искажение имени Великого Бога DjVu на форуме полагается  эцих с гвоздями?
Наверх
 
 
IP записан
 
Страниц: 1 2 3 4 
Послать Тему Печать