OCR форумы Добро пожаловать, Гость. Пожалуйста, выберите Вход или Регистрация
На Форуме произошел сбой системы. Возможна некорректная работа отдельных функций форума. По всем вопросам обращайтесь к Администратору.
The Forum has crashed. Some functions of the forum may not work correctly. For all questions, please contact Administrator.
 
  ГлавнаяСправкаПоискВходРегистрация Администратор Библиотека  
 
Страниц: 1 2 
Послать Тему Печать
Разрешение и цветность. (Прочитано 31621 раз)
Lykas
Патриарх
*****
Вне Форума


Всем привет!

Сообщений: 1070
Разрешение и цветность.
24.04.2005 :: 00:51:22
 
Тема для дискуссии. Какое разрешение и цветность Вы испоользуете при сканировании?
Ясно, что можно сканировать чистый текст 600 DPI  и трицвет, но сколько времени это займет.
1. Чистый текст.
2. Текст с ч/б рисунками.
3. Текст с серыми рисунками.
4. Текст с ч/фотографиями.
5. Текст с цветными рисунками.
6. Текст с цветными фотографиями.
Наверх
« Последняя редакция: 15.01.2012 :: 22:43:54 от Dmitry7 »  
 
IP записан
 
Zmiy
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 106
Минск
Пол: male
Re: Школа OCR. Разрешение и цветность.
Ответ #1 - 24.04.2005 :: 23:42:44
 
Лично я всегда использую 300 dpi. Большего разрешения нет необходимости (это все-таки не для полиграфии).
Чаще сканирую полутоном - смотря какое качество книги (выбирается опытным путем - где меньше ошибок в ФР).
Скан книг ч/б - текст+картинки - 300 ч/б или полутон - всё в ФР.
Скан книг цв. - текст 300 ч/б или полутон - в ФР, картинки отдельно 300 цв(24бит) - в IrfanView/PaintShopPro + коррекции картинок в редакторе и уменьшение до макс.500 точек по высоте (вполне хватит для экранов 800х600/1024х768).
Наверх
 

http://zpdd.chat.ru - Сканирование литературы
WWW  
IP записан
 
Slawa-614
Активист
***
Вне Форума


Всем привет!

Сообщений: 380
Пол: male
Re: Школа OCR. Разрешение и цветность.
Ответ #2 - 25.04.2005 :: 00:42:07
 
Аналогично: текст - 300 ч/б (ФР, чаще с автоматической коррекцией яркости, реже - если бумага тонкая, белая и просвечивают буквы оборотного листа - с ручным подбором яркости).
Картинки - ч/б, серые или цветные - в зависимости от них самих (все в ФР).

Коректура картинок по контрастности, повороту, выравниванию блоков  (на развороте) - на этапе вычитывания в WinWord-е (Ctrl Insert -> Shift Isert в графический редактор, затем сохранить и заменить ею ту, которая осталась в WinWorde).

Разрешение свыше 300 (и не более 400) - только для текстов с мелким шрифтом (газеты, некоторые журналы).

Зачем нужно разрешение 600? Большинство книг напечатано 11-12 кеглем, а детские и вовсе 14-16 - такой текст даже на 200 dpi прекрасно распознается, а вот скорость скана на 600 - возрастает втрое.

Сканить ч/б текст в цвете - тоже нелогично из-за резкого падения скорости (тем более, что результат будет один и тот же).

Наверх
 

Slawa-614
 
IP записан
 
Gautier
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 154
Re: Школа OCR. Разрешение и цветность.
Ответ #3 - 25.04.2005 :: 14:48:44
 
Согласен насчет разрешения при сканировании текста с Zmiy и Slawa, но не согласен насчет сканирования рисунков и, особенно, фото. После долгих опытов обнаружил, что фото сканировать надо при не менее чем 600 dpi (а потом, конечно, обрабатывать и уменьшать размер). Рисунки же тоже, как оказалось, лучше при 600 dpi, но не менее 400 dpi. Подробнее см. в моих "Правилах-2005" (рубрика "Статьи по OCR" у Вадима).
Вообще скажу и здесь, что рисунки сканировать вместе с текстом в FR можно только для "рабочих" (учебных там и т.п.) версий, поскольку текст, конечно, в основном при 300 dpi и только мелкий - 400 dpi.
И добавлю, что ранее я тоже полагал, как отмечает и Zmiy, что графика в версиях достаточна в размере не менее 500 dpi по высоте, однако теперь думаю, что надо больше - на весь экран. Ведь все равно мы видим, что в библиотеку помещают огромные файлы DJVU, так чего уж экономить на графике для версий нужной литературы.
Готье Неимущий
Наверх
 
 
IP записан
 
Zmiy
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 106
Минск
Пол: male
Re: Школа OCR. Разрешение и цветность.
Ответ #4 - 25.04.2005 :: 15:56:57
 
Цитата:
фото сканировать надо при не менее чем 600 dpi

Фото - да. Но простые рисунки и картинки прекрасно смотрятся на экране (!) в том варианте, что я указал (500 точек по высоте).
С фото другие проблемы возникают при сканировании в низких разрешениях... Один муар чего стоит... От него избавлятся очень нудно и качественный результат будет только при больших исходных dpi.
Вон я сканил недавно - "Сафари под Килиманджаро" - более 100 фото сканил в 300 dpi, убирал муар, уменьшал размер, сжимал в jpg - все это для получения небольшого размера (вышло ~5М) при потере качества. Чтобы смотреть на экране - вполне приемлемо получилось.
Сейчас сосканил цветную детскую книжку про солдат - тоже в 300. И тоже будет смотрибельно.

Цитата:
надо больше - на весь экран

Какой "экран" ? Подмигивание 320х240 как в КПК или 10000х8000 как в уличных плазменных панелях?
Не надо стремиться объять необъятное... Нужно делать оптимальный вариант - качество/размер файлов. И уж тут размер файла приоритетнее чем качество. Естественно речь не о схемах и картах, где качество должно быть лучше.

Что по сохранению картинок из ФР в Ворд - так я раньше делал. Но когда увидел, какие размеры получаются по сравнению с отдельным сканированием картинок, их обработкой и уменьшением, а потом уже вставкой в Ворд, - то стал делать только по второму варианту. Тем более визуально большой разницы между большим рисунком от ФР в Ворде и его меньшей обработанной копией, вставленной в Ворд и увеличенной там Масштабом, скажем, на 300%, я не вижу...
Наверх
 

http://zpdd.chat.ru - Сканирование литературы
WWW  
IP записан
 
Gautier
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 154
Re: Школа OCR. Разрешение и цветность.
Ответ #5 - 26.04.2005 :: 16:02:19
 
Снова насчет качества рисунков и фото. Все время исповедуется сиюминутный принцип - чтобы прилично было видно на экране сейчас. И, дескать, 300 dpi достаточно, и в Word при увеличении графики малого размера не видно больших недостатков (последнее - не так, каждый может убедиться).
А вы посмотрите шире - не на сейчас, не на сию минуту, а, по возможности, и на потом, когда и возможности будут лучше. Да и версии могут быть не только на то приготовлены, чтобы их читали или глазели на картинки, но чтобы и работали с ними - брали оттуда фото, рисунки и т.п.
Это как многие покупают компьютеры - самые последние и навороченные (и самые дорогие), чтобы они как можно дольше не устаревали. Однако если для моделей компьютеров такое, по-моему, нецелесообразно (слишком быстро устаревают и уцениваются), то для эл. версий вполне оправдано.
И я тоже писал, как указывает Zmiy, о цели достижения оптимального соотношения размер/качество графики, но, повторю, увидел сколь много в библиотеках огромных DJVU просто с текстами, и решил, что нечего так уж экономить. 300 dpi для любой графики - мало, и это ясно (надо хотя бы 400). Видимо, все дело в разрешении наших глаз, от него плясать надо, и это оно те не менее 400 определяет. Нечего крохоборничать 300 вместо 400, когда на другом теряется уменьшение объема.
Ну, а насчет размеров "по экрану", это я грубо прикидывал. И полагаю, что, наверное, сейчас у подавляющего большинства пользователей не более 1024х768. Или я не прав? Помнится, сколько-то лет назад было какое-то исследование по Интернету, и оказалось, что у большинства - вообще 800х600. Но время прошло, и явно стало несколько больше. Если кто может точно узнать подобный факт, пусть сообщит.
Короче: когда много графики, версии все равно очень большие получаются. Так уж пусть приличная будет.
Наверх
 
 
IP записан
 
Lykas
Патриарх
*****
Вне Форума


Всем привет!

Сообщений: 1070
Re: Школа OCR. Разрешение и цветность.
Ответ #6 - 27.04.2005 :: 02:02:23
 
И добавлю, что ранее я тоже полагал, как отмечает и Zmiy, что графика в версиях достаточна в размере не менее 500 dpi по высоте, однако теперь думаю, что надо больше - на весь экран. Ведь все равно мы видим, что в библиотеку помещают огромные файлы DJVU, так чего уж экономить на графике для версий нужной литературы.
Почему не делать электронные копии в текстовом виде и в DJVU. Хотя я не прав. Разрешение для распознавания текста будет какое при сканировании? А при сканировании иллюстраций, особенно цветных.
Наверх
 
 
IP записан
 
Antikwar
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 78
Москва
Пол: male
Re: Школа OCR. Разрешение и цветность.
Ответ #7 - 06.09.2005 :: 12:26:56
 
Выскажу пожалуй свое мнение...

1. Разрешение. Вопрос: для чего потом будут использоваться изображения? Ничего более требовательного к изображению чем полиграфия, мне на данный момент в голову не приходит. В полиграфии же как правило используется разрешение в 300 dpi. Зачем тогда делать изображения большего разрешения? Единственный логичный ответ - чтобы потом их можно было увеличить. Но это уже из другой области.
2. Изменение разрешения и цветности. Какой смысл сканировать изображения в 600 dpi, если впоследствии оно будет уменьшено до 300 (ладно, пусть 400) dpi? Дело в том, что чисто теоретически, при любом изменении исходного изображения (изменения разрешения, цветовой схемы и вообще любой корректировке) происходит потеря качества изображения, поэтому целесообразно проводить всю коррекцию изображения на этапе сканирования. Хорошие сканеры это позволяют.
3. Изменение форматов. Лучше все операции по кооректировке изображения проводить, сохраняя промежуточные варианты в каком-нибудь формате, не дающем потери качества: tiff, psd - ни в коем случае не jpeg! И переводить в сжатые форматы только финальную версию.

PS. 1. Все вышесказанное относится к "идеальному" сканеру. Хороший сканер позволяет провести цветокоррекцию, убрать муар и пр. на этапе сканирования - то есть работа идет с "превьюшкой", а сканируется (и сохраняется) готовое изображение. Мой домашний сканер этого не позволяет. Сканер, стоящий у меня на работе (Хейдельберг) - позволяет частично. А вот Агфа, с которой я работал раньше, позволяла практически все.
2. При наших задачах потерями качества, происходящими в результате вышеописанных преобразований можно смело принебречь. Если же хочется идеального изображения, имеет смысл продать всю недвижимость и купить барабанный сканер. Улыбка Правда книжки на нем сканировать не получится.

PPS. Большая часть людей, пользующихся электронными библиотеками, читает книги на всякого рода электронных устройства, и лишний вес файла для них - только помеха. Лично я предпочитаю книги с иллюстрациями, но с иллюстрациями небольшого разрешения. И уж в любом случае, книга должна быть мне жизненно необходима, чтобы я взялся качать файл больше 1,5 мегабайт (в моем районе на данный момент - только модемное подключение). Версия же в txt без картинок меня не сильно устраивает. Что делать? Две версии с картинками (высокого и низкого разрешения)?
Наверх
 
 
IP записан
 
Gautier
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 154
Re: Школа OCR. Разрешение и цветность.
Ответ #8 - 26.09.2005 :: 16:04:32
 
Теоретически все высказанное кажется правильным (и я так думал, хотя и не специалист), однако голая эмпирика, которой я занимался долгое время, не позволяет мне согласиться с верностью сказанного. По крайней мере, для тех мониторов (в 15 и в 17 дюймов), с которыми я работал. Наверное, в теории имеются какие-то огрехи, ибо практика показывает, что она не совсем верна. Далее идет попытка ответить Antikwar по пунктам.

1. Разрешение. Может, в полиграфии и используется только 300 dpi, но можно видеть, насколько хуже изображение в 300 dpi на экране, чем на бумаге (при том же размере по ширине-высоте). С 400 и, особенно, 600 dpi гораздо лучше. Почему все это так, мне неизвестно (возможно, Antikwar имеет в виду рисунки, а я – и фото в том числе; или же у меня такой кривой сканер, а он старый и простой). Основной же принцип, которого надо придерживаться, как мне кажется, соответствует словам Antikwar: качество изображения должно быть не хуже, чем в книге. Именно тогда получить копия «навсегда» (т.е., как бы «увековечивание» книги).

2. Изменение разрешения и цветности. Ясно, что когда изображение уменьшают после 600 dpi, то его качество теряется. Но по каким-то причинам, если так адаптировать фото в 600 dpi, то оно получается лучше, чем если делать, к примеру, в 400 dpi (не говоря уже о 300), а потом приводить к тем же размерам. Я выполнил очень много фото в книгах по полярным исследованиям, и в процессе этого обнаружил, что обработанное в 600 почему-то лучше, чем такого же размера по ширине-высоте, но бывшее исходно в 400. Где-то в теории что-то не учтено (или недосказано).
PS. 2. Ничего не понял. Идеальное изображение – это же по качеству как на бумаге в оригинале (см. выше). Ведь лучше же не получится, наверное. Да и задача, все же, сделать копию как можно более аутентичной (копию изображения, конечно, а не опечаток). Вряд ли получится ее сильно улучшить (про уборку «мусора» речь не идет). Книгу из бумаги – в эл. версию для будущего.
PPS. Цитаты: «Большая часть людей, пользующихся электронными библиотеками, читает книги на всякого рода электронных устройства, и лишний вес файла для них - только помеха». «Что делать? Две версии с картинками (высокого и низкого разрешения)?»
Не знаю. Я делаю картинки, только когда они действительно необходимы (очень подробно писал об этом в своих «Правилах OCR-2005»). Когда – информация или особая ценность иллюстраций. И не жалею размера. А малую версию в rtf – вовсе без картинок (но указываю в последней, что так и так, имеется, де, и полная, с фото и иллюстрациями). Кому надо – переделает графику на своем сайте из большой в малую. Если книга кому-то действительно нужна, причем вся, то ее выкачают как-нибудь (или попросят кого-нибудь). Всем не угодишь. И, к тому же, этот вопрос, на мой взгляд, пустой, ибо подавляющее большинство литературы (худож., детективы и пр.) вовсе не нуждается в том, чтобы ее в эл. версиях иллюстрировали.
Наверх
 
 
IP записан
 
Ustas
Постоялец
**
Вне Форума


даешь качественный OCR!

Сообщений: 176
Пол: male
Re: Школа OCR. Разрешение и цветность.
Ответ #9 - 26.09.2005 :: 22:27:33
 
Gautier писал(а) 26.09.2005 :: 16:04:32:
Всем не угодишь. И, к тому же, этот вопрос, на мой взгляд, пустой, ибо подавляющее большинство литературы (худож., детективы и пр.) вовсе не нуждается в том, чтобы ее в эл. версиях иллюстрировали.


Лично мне интересны иллюстрации в ходожественной литературе.
Особенно приключенческой.
Особенно доперестроечной эпохи.

ЗЫ Правда, работать с иллюстрациями (сканить/обрабатывать) я пока не научился.  Смущённый
("Я не волшебник, а только учусь"  Круглые глаза )

Вот с ужасом жду очереди ЖЗЛ "Вальтер Скотт"  Нерешительный
Наверх
 
WWW 67730822  
IP записан
 
Gautier
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 154
Re: Школа OCR. Разрешение и цветность.
Ответ #10 - 27.09.2005 :: 14:02:02
 
Насчет иллюстраций к художественной. Придется повторить уже написанное в тех "Методах-OCR". Вот мы имеем два-три разных издания в городах Мухоморске, Песьегонске и Заборске. Их иллюстрировали некие рядовые, никому не известные художники. На хрен их иллюстр. в версии, да и почему, к примеру, художник из Песьегонска (с чьего издания делается OCR) для нас важнее, чем рисовальщие из Мухоморска (чье издание недоступно)? К тому же сами мы образно можем представлять все еще третьим способом (и, может, лучше будет, чем у тех художников). Это касается и доперестроечных изданий, в особенности хрущевской эпохи, когда, к примеру, научно-популярное и путешествия иллюстрировали по-простому, типа линогравюр (как строили хрущобы).
Другое дело, когда информация в рисунках (см. рисунки к версии Ершова "Тайна жрецов майя"), либо иллюстрации выполнены маститыми, известными художниками. Вот Гашек и Диккенс без иллюстраций того времени весьма теряют, если не сказать большее.
Наверх
 
 
IP записан
 
Ustas
Постоялец
**
Вне Форума


даешь качественный OCR!

Сообщений: 176
Пол: male
Re: Школа OCR. Разрешение и цветность.
Ответ #11 - 27.09.2005 :: 15:46:31
 
ну вот такой у меня субъективный бзик - люблю песьегонское и мочегорское лубочное примитивное творчество, считаю его неотъемлемым атрибутом конкретного издания.  Круглые глаза

И потом, искусство иллюстраций - это такая скользкая тема, опять же субъективно-вкусовая


ЗЫ "Методическое руководство" читал  Класс
Наверх
 
WWW 67730822  
IP записан
 
Antikwar
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 78
Москва
Пол: male
Re: Школа OCR. Разрешение и цветность.
Ответ #12 - 28.09.2005 :: 11:59:57
 
Ustas писал(а) 27.09.2005 :: 15:46:31:
ну вот такой у меня субъективный бзик - люблю песьегонское и мочегорское лубочное примитивное творчество, считаю его неотъемлемым атрибутом конкретного издания.  Круглые глаза

И в этом Ustas не одинок. Мне кажется, что если технология позволяет, то почему бы и не сделать? А в детских книгах иллюстрации, имхо, обязательны.
Что радует, по крайней мере сейчас никто уже не спорит о необходимости сохранять форматирования текста (курсив и пр.).
Наверх
 
 
IP записан
 
Zmiy
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 106
Минск
Пол: male
Re: Школа OCR. Разрешение и цветность.
Ответ #13 - 29.09.2005 :: 09:45:46
 
Цитата:
Что радует, по крайней мере сейчас никто уже не спорит о необходимости сохранять форматирования текста (курсив и пр.).

Я спорю!
Во-первых, ФР4-8 не дает полной возможности сохранять все типы форматирований. Для меня лучше сохранить форматирование строк (устраняя склеивание или разделение абзацев) чем всякие курсивы, а для всех остальных - наоборот. В итоге мои тексты выглядят правильно и одинаково в любых форматах.
Во-вторых, разные издания или, что хуже, левые перепечатки книг потеряют эти самые форматирования или сделают свои.
В-третьих, если книгу воспринимать на слух (например через Говорилки), то курсивы и др. там вроде никак и не выделяются.
Наверх
 

http://zpdd.chat.ru - Сканирование литературы
WWW  
IP записан
 
Antikwar
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 78
Москва
Пол: male
Re: Школа OCR. Разрешение и цветность.
Ответ #14 - 29.09.2005 :: 19:06:50
 
Zmiy писал(а) 29.09.2005 :: 09:45:46:
Я спорю!
Во-первых, ФР4-8 не дает полной возможности сохранять все типы форматирований. Для меня лучше сохранить форматирование строк (устраняя склеивание или разделение абзацев) чем всякие курсивы, а для всех остальных - наоборот. В итоге мои тексты выглядят правильно и одинаково в любых форматах.
Во-вторых, разные издания или, что хуже, левые перепечатки книг потеряют эти самые форматирования или сделают свои.
В-третьих, если книгу воспринимать на слух (например через Говорилки), то курсивы и др. там вроде никак и не выделяются.

Не очень понимаю, какая связь между абзацами и курсивом? Я, во время сканирования первых книжек, заметил что делает FR с абзацами и прешел к выводу, что надо сверять все абзацы с книгой. Вручную. Так сейчас и делаю. А задно и курсив проверяю.
Бывют книжки, где курсив сделан для красоты, бывают - где с дуру, а бывает и смысловое выделение текста. Мне кажется лучше его сохранять.
На счет говорилок не знаю, а электронные устройства для чтения курсив поддерживают. Так что пусть будет.
Наверх
 
 
IP записан
 
Zmiy
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 106
Минск
Пол: male
Re: Школа OCR. Разрешение и цветность.
Ответ #15 - 29.09.2005 :: 23:28:56
 
Цитата:
Не очень понимаю, какая связь между абзацами и курсивом?

1) ФР при распознавании в режиме "Тип страницы" "Авто" иногда неправильно ставит знак "конец абзаца" - в результате при переформатировании в Ворде или сохранении в тхт абзацы клеятся или разделяются.
2) ФР при распознавании в режиме "Тип страницы" "Форматированный пробелами текст" абзацы выделяет пробелами и потом просто можно преобразовать в текст для Ворда (см. у меня на странице утилитку cltxt.exe).
Так вот в (1) курсивы и иже с ним распознаются, а в (2) нет. Т.е. надо выбирать - или неправильные абзацы с курсивами, или правильные абзацы без курсива, или сидеть и долго проверять абзацы и курсивы.
Я выбрал (2). Но на проверку - где в книге курсивы, а где нет - сил уже не хватает. Тем более, если нет уже книги, то после того, что сканер или ФР делает с изображениями... там бывает и не поймешь - был курсив или плавают строчки...
По крайней мере мне приятно читать книгу с правильными абзацами...

Для разработчиков ФР я написал кучу(более 20) рекомендаций(требований) что исправить в ФР8. Но они увы ничего не сделали. Ну не видят они проблемы "абзацев"...
Наверх
 

http://zpdd.chat.ru - Сканирование литературы
WWW  
IP записан
 
Gautier
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 154
Re: Школа OCR. Разрешение и цветность.
Ответ #16 - 10.10.2005 :: 16:35:54
 
Насчет курсивов.
В сотый раз: речь идет об авторских курсивах, вернее, об авторских отметках и ударениях (может, они там в своих рукописях при свече просто подчеркивали или разрядку делали). Чего тут обсуждать-то? А ставить критерием чтобы "одинаково во всех форматах" даже за счет потери авторского смысла, это, знаете, странно. Кстати, ранее в TXT подобные отметки делали отбивая после каждой буквы нижнее тире (или как его там), т.е., делая разреженный текст. Понимали, значит, что отметки сохранять надо. А теперь перестали вдруг понимать.
Наверх
 
 
IP записан
 
amyatishkin
Активист
***
Вне Форума


Всем привет!

Сообщений: 426
Re: Школа OCR. Разрешение и цветность.
Ответ #17 - 13.10.2005 :: 10:08:48
 
Текстовая книга сканиться в ФР при 300 дпи и автоматической яркости. При мелком шрифте - большие примечания, предисловия, т.п. - есть смысл делать 400. Причем вначале сканится разворот без резки страниц, а потом это конвертиться во второй пакет с отдельными страницами. Дело в том, что так проще проконтролировать правильность сканирования и правильность разрезания страниц. Вкладки+обложка - отдельно как надо.

Книга со множеством иллюстраций на страницах (не на вкладках) - через ACDSee и программу сканера, серый, 300 дпи.
Фокус: если есть вышеупомянутый мелкий шрифт - можно все сканы пакетным способом увеличить раза в 1,5. Качество обычного текста это не повысит, а мелкого - весьма и весьма. Вдобавок из этого же можно слепить высококачесвенный DjVu. Но распознанный в ФР текст окажется в гигантских шрифтах - что меня не волнует.

Чб рисунки обычно хорошо смотрятся при 150 дпи, поэтому их можно уменьшить в 2 раза из скана на 300. (возможны варианты)
Для фотографий требуется убирать растр, поэтому надо по качеству фот смотреть. Глянцевая бумага, высококачественая печать  - 600 дпи, обычная вкладка - 300. При хорошем/обычном качестве можно уменьшить в 2 раза, при отвратном - в 3-4. Все равно  больше на фотографии ничего не рассмотришь. А дальнейшее уменьшение зависит от ценности фот.
Наверх
 
 
IP записан
 
monday2000
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 98
Пол: male
Re: Школа OCR. Разрешение и цветность.
Ответ #18 - 11.12.2007 :: 12:55:16
 
Я написал статью:

Базовые понятия DjVu-книгосканирования


http://www.djvu-soft.narod.ru/scan/scan_likbez.htm

Цель статьи - ввести полного новичка в курс дела DjVu-книгосканирования.
Наверх
 
WWW  
IP записан
 
папаВлад
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 100
Подмосковье
Пол: male
Re: Разрешение и цветность.
Ответ #19 - 23.02.2012 :: 13:34:03
 
Lykas писал(а) 24.04.2005 :: 00:51:22:
Тема для дискуссии. Какое разрешение и цветность Вы испоользуете при сканировании?
Ясно, что можно сканировать чистый текст 600 DPI  и трицвет, но сколько времени это займет.
1. Чистый текст.
2. Текст с ч/б рисунками.
3. Текст с серыми рисунками.
4. Текст с ч/фотографиями.
5. Текст с цветными рисунками.
6. Текст с цветными фотографиями.

Ч/б в сером, цветные, соответственно в цвете.
Все сканирую в 300 DPI, хотя и попадается мелкий шрифт. Не использую при сканировании 600, лишь из-за того, что дальнейшая обработка занимает гораздо больше времени.
По-моему мнению (на сегодняшний день), важнее обратить внимание на то, как будет сжиматься подготовленный материал.
После того, как страницы готовы к сжатию:
- первый вариант, без измения размера и дпи, сжимается с профилем "фото" - получается большой по размеру файл с оригинальным качеством
- второй вариант в IrvanView увеличиваю размеры до 200% и DPI до 600 (по наводке Вадима), полученные tiff сжимаю в Document Express Editor с такими настройками: Профиль "Рисунок", Разрешение DPI - 300 или 400 (по ситуации), Качество текста "почти без потерь", в итоге djvu маленького размера с преемлемым качеством. При этом сжатии любой мелкий текст остаётся читабельным.
-
Я хочу, чтобы меня переубедили, объяснили зачем сканировать на 600 DPI.

DJVU Solo не пользуюсь, считаю, что там недостаточно настроек сжатия или они непонятно подписаны, вобщем непонравился.
Наверх
 
 
IP записан
 
Dmitry7
Модератор
*****
Вне Форума


Соберем Серии "НВЖНиТ"!

Сообщений: 5863
Санкт-Петербург
Пол: male
Re: Разрешение и цветность.
Ответ #20 - 23.02.2012 :: 14:28:14
 
Lykas писал(а) 24.04.2005 :: 00:51:22:
Тема для дискуссии. Какое разрешение и цветность Вы испоользуете при сканировании?
Ясно, что можно сканировать чистый текст 600 DPI  и трицвет, но сколько времени это займет.
1. Чистый текст.
2. Текст с ч/б рисунками.
3. Текст с серыми рисунками.
4. Текст с ч/фотографиями.
5. Текст с цветными рисунками.
6. Текст с цветными фотографиями.

1-4. 300dpi/ 256 оттенков серого
5. 300dpi/ 24-bit или 8 bit цвет
6. 300dpi/ 24-bit

и еще: при сканировании журналов с очень мелкими буквами
600 dpi / 256 оттенков серого


в других случаях 600 dpi никогда не использую из-за существенного увеличения времени сканирования и размеров сканов.
как мне кажется, в большинстве случаев программное увеличение 300->600 dpi даёт удовлетворительный (в смысле вполне приемлемый) результат

Наверх
 

"Если хочешь сделать что-то хорошо, сделай это сам!"
332371574  
IP записан
 
Dmitry7
Модератор
*****
Вне Форума


Соберем Серии "НВЖНиТ"!

Сообщений: 5863
Санкт-Петербург
Пол: male
Re: Разрешение и цветность.
Ответ #21 - 23.02.2012 :: 14:33:07
 

мне весьма нравится профиль  Arcand Scanned в DjVu Small
( к сожалению, не смог его приделать к DEE 5,6... - Может, кто подскажет, как?)


Этот профиль применяю, когда есть серые/цветные рисунки в тексте, и нужно получить файл весом меньше 50 Мб для книг в 400 стр. и больше

Недостаток: серые рисунки газетного типа (встречаются в старых книгах) этим профилем кодируются плохо (размытые пятна появляются), поэтому применяю в этом случае профиль "Фото"
Наверх
 

"Если хочешь сделать что-то хорошо, сделай это сам!"
332371574  
IP записан
 
r2017
Новичок
*
Вне Форума


Всем привет!

Сообщений: 14
Пол: male
Re: Разрешение и цветность.
Ответ #22 - 03.03.2012 :: 19:54:41
 
Хм. 300 для текстовых достаточно? Буду знать.
Наверх
 
WWW  
IP записан
 
Владислав_72
Активист
***
Вне Форума



Сообщений: 337
Москва
Пол: male
Re: Разрешение и цветность.
Ответ #23 - 29.04.2012 :: 16:51:33
 
Цитата:
Я хочу, чтобы меня переубедили, объяснили зачем сканировать на 600 DPI.

В двух словах - 300дпи - это "сейчас", 600 дпи - "потом" (причем уже не далекое, а весьма близкое)
Наверх
 
 
IP записан
 
Dmitry7
Модератор
*****
Вне Форума


Соберем Серии "НВЖНиТ"!

Сообщений: 5863
Санкт-Петербург
Пол: male
Re: Разрешение и цветность.
Ответ #24 - 12.08.2012 :: 10:14:05
 


Огромная просьба ко всем Сканировщикам:


сканируйте, пожалуйста, все страницы с
библиотечными штампами
(обычно 1-3-я и 17-я), а также страницы с пометками цветными ручками
, в цвете
,
чтобы потом можно было отфильтровать цвет чернил и проще стирать следы штампов (даже если вся книга черно-белая)
Наверх
 

"Если хочешь сделать что-то хорошо, сделай это сам!"
332371574  
IP записан
 
pohorsky
Патриарх
*****
Вне Форума


Подключайтесь к проекту
"Вся МРБ"!!!

Сообщений: 5895
Москва
Пол: male
Re: Разрешение и цветность.
Ответ #25 - 18.01.2015 :: 20:13:18
 
Закодировал в DJVU - с профиле кодирования фото, 600 дпи обложку:
http://zalivalka.ru/192965/obl1.djvu

Потом размыл (пятно - Гаусс) на 2 единицы и снова закодировал с тем же профилем:
http://zalivalka.ru/192966/obl1razmyt.djvu

Размер уменьшился в три раза.
Кто может прокомментировать?
Наверх
 
 
IP записан
 
slava_kry
Гуру
****
Вне Форума



Сообщений: 551
Re: Разрешение и цветность.
Ответ #26 - 18.01.2015 :: 20:40:16
 
pohorsky писал(а) 18.01.2015 :: 20:13:18:
Кто может прокомментировать?

Простите, а что комментировать-то? Шумы сгладились - результат очевиден. Улыбка
Вот попробуйте: https://yadi.sk/i/UhZlcOqpe55yk
Наверх
« Последняя редакция: 18.01.2015 :: 20:50:41 от slava_kry »  

Он сказал им: вы выказываете себя праведниками пред людьми, но Бог знает сердца ваши, ибо что высоко у людей, то мерзость пред Богом.
 
IP записан
 
pohorsky
Патриарх
*****
Вне Форума


Подключайтесь к проекту
"Вся МРБ"!!!

Сообщений: 5895
Москва
Пол: male
Re: Разрешение и цветность.
Ответ #27 - 18.01.2015 :: 21:43:08
 
pohorsky писал(а) 18.01.2015 :: 20:13:18:
Закодировал в DJVU - с профиле кодирования фото, 600 дпи обложку:
http://zalivalka.ru/192965/obl1.djvu

Потом размыл (пятно - Гаусс) на 2 единицы и снова закодировал с тем же профилем:
http://zalivalka.ru/192966/obl1razmyt.djvu

Размер уменьшился в три раза.
Кто может прокомментировать?


Попробовал. Результат тот же, ( 781 кБ у исходного и 195 кБ у размытого) хотя шумов в исходном фале нет.
Наверх
 
 
IP записан
 
mor
Патриарх
*****
Вне Форума



Сообщений: 1768
Пол: male
Re: Разрешение и цветность.
Ответ #28 - 18.01.2015 :: 22:07:23
 
дело в резких краях, которые сложны для кодирования.

Можно более простой пример:
http://files.etherway.ru/7C14CIZGGYIR55X40WXE

Разница в 1,5 раза

Наверх
 
 
IP записан
 
pohorsky
Патриарх
*****
Вне Форума


Подключайтесь к проекту
"Вся МРБ"!!!

Сообщений: 5895
Москва
Пол: male
Re: Разрешение и цветность.
Ответ #29 - 18.01.2015 :: 22:16:41
 
mor писал(а) 18.01.2015 :: 22:07:23:
дело в резких краях, которые сложны для кодирования.

Можно более простой пример:
http://files.etherway.ru/7C14CIZGGYIR55X40WXE

Разница в 1,5 раза



Да, Малевич отдыхает.

Делаем вывод - небольшое размытие на малоцветных иллюстрациях (обложках) уменьшает размер файла djvu
Наверх
 
 
IP записан
 
Страниц: 1 2 
Послать Тему Печать