OCR форумы Добро пожаловать, Гость. Пожалуйста, выберите Вход или Регистрация
Форум переведен из кодировки UTF-8 в кодировку WINDOWS-1251. По всем вопросам, связанным с кодировкой текста (появлением «кракозябр»), обращайтесь к Администратору.
The forum is translated from the UTF-8 encoding to the WINDOWS-1251 encoding. For all questions related to the encoding of the text (the appearance of 'krakozyabr'), please contact the Administrator.
 
  ГлавнаяСправкаПоискВходРегистрация Администратор Библиотека  
 
Переключение на Главную Страницу Страниц: 1
Послать Тему Печать
Шрифт в djvu - перемычки и засечки (Прочитано 1777 раз)
Dmitry7
Модератор
*****
Вне Форума


Соберем Серии "НВЖНиТ"!

Сообщений: 4702
Санкт-Петербург
Шрифт в djvu - перемычки и засечки
03.01.2017 :: 19:40:50
 


Послушал я тут урок по сканкромсатору от AAW

https://www.youtube.com/watch?v=NfvHZJ2KhsM&feature=em-subs_digest

и закралось сомнение - а может, черт с ними, с пропадающими перемычками в "Н" и "И" ?
Действительно, если добиваться четкости этих перемычек, остальной шрифт ужирняется и закругляется, и пропадает "линия строки, образованная засечками шрифта"
Наверх
 

"Если хочешь сделать что-то хорошо, сделай это сам!"
332371574  
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 3843
Екатеринбург
Пол: male
Re: Шрифт в djvu - перемычки и засечки
Ответ #1 - 03.01.2017 :: 21:17:51
 
ну а распознавание?

да и вообще, это ведь моё личное мнение. дальше моих сканов это мнение нелегитимно.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
Dmitry7
Модератор
*****
Вне Форума


Соберем Серии "НВЖНиТ"!

Сообщений: 4702
Санкт-Петербург
Re: Шрифт в djvu - перемычки и засечки
Ответ #2 - 03.01.2017 :: 22:01:19
 
AAW писал(а) 03.01.2017 :: 21:17:51:
ну а распознавание?
да и вообще, это ведь моё личное мнение. дальше моих сканов это мнение нелегитимно.

Вы же сами говорили - это палка о двух концах (даже о трех Улыбка ):
1) красивость текста - округлые жирные буквы (и, возможно, легкость распознавания, но не факт)
2) насколько сильно будут уставать глаза при чтении с экрана (или с бумаги) - есть противоречие с п.1
3) что получится при печати? (возможно, на экране будет легко читаться, а при распечатке - плохо)
Наверх
 

"Если хочешь сделать что-то хорошо, сделай это сам!"
332371574  
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 3843
Екатеринбург
Пол: male
Re: Шрифт в djvu - перемычки и засечки
Ответ #3 - 04.01.2017 :: 05:41:40
 
Dmitry7 писал(а) 03.01.2017 :: 22:01:19:
Вы же сами говорили - это палка о двух концах

Именно. Я не могу доказать своё мнение о том, что буквы надо делать потоньше и почётче. Всё, что я хотел сказать на ютьюбе - добивайтесь компромисса между вышеприведёнными тремя пунктами. Их я и показал. Критерием служит совпадение с контурами на скане (всё хочу какую-нибудь программку, которая бы дельту наглядно показывала...)
Есть ещё и четвёртый пункт: количество мусора для окончательной чистки. Бывает, добьёшься нормального вида - но мусора вылазит столько, что чистить месяц. Отказываюсь Печаль

да, ещё: чем жирнее буквы, тем больше риска эффекта "инь". Видимо, процент совпадения контуров на более жирненьких буквах проще становится повыше, чем порог неразличимости и замены, - потому что "чёрного больше" Улыбка. Бывает, даже на 600дпи, на вполне чётких контурах, если буквы маленького кегля, и у них Bold-вариант начертания, то "инь" появляется. Особенно на гарнитуре как в Желязны, что я в видео показал. Довольно толстенькой самой по себе.
Наверх
« Последняя редакция: 04.01.2017 :: 06:07:31 от AAW »  

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 3843
Екатеринбург
Пол: male
Re: Шрифт в djvu - перемычки и засечки
Ответ #4 - 04.01.2017 :: 06:34:43
 
Для себя я применяю примерно такой алгоритм: ищу настройки enhance, которые как можно лучше вытягивают  полустёртые перемычки, поглядывая, не корёжится ли контур шрифта в самых жирных местах страницы. Как только почуял, что "хорош ужирнять", смотрю как дела с полустёртостью. Если терпимо, то есть легкочитаемо в виде "две страницы на экране монитора в масштабе "по высоте страницы"", и полустёртость проявлена не больше чем в одном слове подряд - то останавливаюсь. Глаз восстановит смысл. А если всё плохо с читаемостью, то а) заменяю глифы и б) если заменять ну уж очень много, то отказываюсь от бинаризации и пакую страницу в photo (IW44), либо ищу другой экземпляр книги и пересканирую. Это нагляднее всего - в машинописных методичках институтов. Лента была с бледной краской, а формулы вписывали перьевой ручкой по плохой бумаге (то есть чернила растекались). Ужирняешь буквы печатной машинки - формулы сразу становятся жирными кляксами.
Конечно, на смысл текста надо смотреть. Пропажи в формулах и схемах/чертежах - уничтожают книгу целиком. Где избыточности нет, там догадаться нельзя, как в худтексте.
Наверх
« Последняя редакция: 04.01.2017 :: 08:19:26 от AAW »  

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
altruist
Активист
***
Вне Форума


Всем привет!

Сообщений: 299
Russia.Penza
Пол: male
Re: Шрифт в djvu - перемычки и засечки
Ответ #5 - 20.02.2017 :: 14:39:19
 
Dmitry7 писал(а) 03.01.2017 :: 19:40:50:
Послушал я тут урок по сканкромсатору от AAW

https://www.youtube.com/watch?v=NfvHZJ2KhsM&feature=em-subs_digest

и закралось сомнение - а может, черт с ними, с пропадающими перемычками в "Н" и "И" ?
Действительно, если добиваться четкости этих перемычек, остальной шрифт ужирняется и закругляется, и пропадает "линия строки, образованная засечками шрифта"

Попался журнал, при бинаризации в статьях, где использовали шрифт с засечками, пришлось довольно долго восстанавливать буквы. Появилась идея использовать для восстановления FR, т.к. ему почти без разницы есть перемычки или нет. Для примера, текст исправлен обычным способом  https://yadi.sk/i/Bwo8XzX43EJ2bY и с помощью FR https://yadi.sk/i/ZJQ2wAUy3EJ2fg
Наверх
 

Хорошая вещь компьютер...Посидел пять минут-полтора часа прошло....
 
IP записан
 
Переключение на Главную Страницу Страниц: 1
Послать Тему Печать