OCR форумы Добро пожаловать, Гость. Пожалуйста, выберите Вход или Регистрация
Форум переведен из кодировки UTF-8 в кодировку WINDOWS-1251. По всем вопросам, связанным с кодировкой текста (появлением «кракозябр»), обращайтесь к Администратору.
The forum is translated from the UTF-8 encoding to the WINDOWS-1251 encoding. For all questions related to the encoding of the text (the appearance of 'krakozyabr'), please contact the Administrator.
 
  ГлавнаяСправкаПоискВходРегистрация Администратор Библиотека  
 
Страниц: 1 2 3 4
Послать Тему Печать
Сканирование с искажением? Такое встречается? (Прочитано 75193 раз)
Alex55
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 138
Москва
Пол: male
Сканирование с искажением? Такое встречается?
20.02.2012 :: 08:16:31
 
Не нашёл на форуме раздела по технике сканирования, поэтому свой вопрос помещаю в данном разделе.
Я впервые столкнулся с удивительным фактом.
Скачал по одной из рекомендованных ссылок книгу Б.В.Некрасова "Основы общей химии" в двух томах. 1973г. Издательство "Химия". Ленинград. Формат djvu. Текст не распознан, только изображения.
Решил сам провести распознавание. И только тогда обратил внимание на удивительный факт:
слова русского текста имеют в изображениях страниц книги множество опечаток. Повторяю, речь не об ошибках распознавания, а об опечатках, заметных визуально на изображениях страниц книги. Уже количество опечаток вызывает оторопь. Но и "качество" их поразительно.
Например.
В большом количестве слов вместо букв "и" стоят буквы "н". И наоборот: "и" вместо "н".
Эти две буквы в шрифте книги сходны по написанию, так что плохо пропечатанную "н" можно, конечно, иногда принять за "и". Про такие случаи я бы не то что на форум не писал, но даже не стал бы над ними задумываться.
Но тут другое. На месте буквы "и" в словах стоят очень чётко пропечатанные буквы "н". И наоборот.
Не может ли такое  МАССОВОЕ ИСКАЖЕНИЕ ТЕКСТА быть результатом работы программы, которая пытается таким нехорошим способом сжать графическую информацию?
В результате чуть не в каждом предложении ПРИ ВИЗУАЛЬНОМ ЧТЕНИИ DJVU попадается такое: ннтрнд, иитрнд, ннтрит, гипофосфнт, окнсь...
Печальную картину дополняют связя вместо связи, такще вместо также и тому подобное.
На что грешить? Неужели наборщики так напортачили в 1973 году?
О злокозненных действиях цифрующих обработчиков книги я стараюсь подозрений не питать. Но если кому-либо известны подобные факты, прошу поделиться информацией и соображениями по этому вопросу.
Предвидя заранее, что меня станут упрекать в излишней мнительности, скажу о себе:
я всегда предпочитаю разобраться в подлинных причинах, а не придумывать такие, которые мне больше нравятся.
Наверх
 
WWW  
IP записан
 
dns
Гуру
****
Вне Форума


Всем привет!

Сообщений: 942
Красноярск
Пол: male
Re: Сканирование с искажением? Такое встречается?
Ответ #1 - 20.02.2012 :: 08:48:31
 
Ошибка не сканирования, а кодирования в djvu, проблема решается кодированием в 600 dpi.

http://www.djvu-soft.narod.ru/scan/in_problem.htm
Наверх
 
 
IP записан
 
bolega
Патриарх
*****
Вне Форума



Сообщений: 1031
Re: Сканирование с искажением? Такое встречается?
Ответ #2 - 20.02.2012 :: 08:52:10
 
Alex55
Проблема давно известная, описанная и обмусоленная лет 5-7 назад. Странно, что Вы до сих пор этого не знали
Наверх
 
 
IP записан
 
Alex55
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 138
Москва
Пол: male
Re: Сканирование с искажением? Такое встречается?
Ответ #3 - 20.02.2012 :: 10:43:31
 
bolega писал(а) 20.02.2012 :: 08:52:10:
Alex55
Проблема давно известная, описанная и обмусоленная лет 5-7 назад. Странно, что Вы до сих пор этого не знали
Почему же странно? Во-первых, информационное пространство в последние 20 лет проросло трудно проницаемыми перегородками. Во-вторых, за 5-7 лет я решал множество других проблем. Для меня книги - не самоцель, а средство.

Странно, что для Вас странно, что я до сих пор не знал.
Наверх
 
WWW  
IP записан
 
Alex55
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 138
Москва
Пол: male
Re: Сканирование с искажением? Такое встречается?
Ответ #4 - 20.02.2012 :: 10:50:48
 
dns писал(а) 20.02.2012 :: 08:48:31:
Ошибка не сканирования, а кодирования в djvu, проблема решается кодированием в 600 dpi.

http://www.djvu-soft.narod.ru/scan/in_problem.htm
Большое спасибо. Как программист с дореволюционным стажем считаю, что руки бы оторвать разработчикам и распространителям такого кодирования.
А скачанный djvu, сделанный очевидно некачественно, можно, значит, выкинуть? Книжки у меня нет, к сожалению.
Наверх
 
WWW  
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 4869
Екатеринбург
Пол: male
Re: Сканирование с искажением? Такое встречается?
Ответ #5 - 20.02.2012 :: 11:02:54
 
Alex55 писал(а) 20.02.2012 :: 10:50:48:
руки бы оторвать разработчикам и распространителям такого кодирования.

И не хотелось бы ругаться публично, и - "надо, Федя, надо!"
Вы зачем несёте Зло людям? Зачем стремитесь оставить за собой последнее слово любым способом? Подумайте над этим вопросом. Мы здесь если высказываемся резко, то ненамеренно. А у вас за три дня общения - "переход на личности" через раз. Оторвать руки - значит и тем, кто здесь и сейчас делает книги, и ведущим торрент-трекеры и либген и так далее... Приезжайте и оторвите, но в личной встрече. Не гадьте на форуме впустую.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
Alex55
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 138
Москва
Пол: male
Re: Сканирование с искажением? Такое встречается?
Ответ #6 - 20.02.2012 :: 11:31:09
 
AAW писал(а) 20.02.2012 :: 11:02:54:
Вы зачем несёте Зло людям?
Серьёзное обвинение. Пожалуй даже слишком. Не думаю, что у Вас или у кого-либо ещё есть моральное право писать такое на публичном форуме.

Готов объясниться, что я не несу Зла людям. Видимо это можно сделать в подходящем для таких тем месте.
А здесь мы имеем простой факт, о котором я написал.
Битая цифровая копия распространяется по сети, а защитники добра против такого зла беспомощны.

AAW писал(а) 20.02.2012 :: 11:02:54:
Зачем стремитесь оставить за собой последнее слово любым способом? Подумайте над этим вопросом...
Вы написали про меня НЕПРАВДУ. Когда я согласен с выступающими, то очень часто оставляю последнее слова не за собой. А делать вид, что согласен, когда не согласен в вопросах общественного уровня, - такой "безразличный" стиль общения слишком дорого нам обходится, чтобы на нём столь энергично настаивать.
Наверх
 
WWW  
IP записан
 
AlVaKo
Активист
***
Вне Форума



Сообщений: 330
Алма-Ата
Пол: male
Re: Сканирование с искажением? Такое встречается?
Ответ #7 - 20.02.2012 :: 13:48:49
 
Alex55 писал(а) 20.02.2012 :: 10:50:48:
Большое спасибо. Как программист с дореволюционным стажем считаю, что руки бы оторвать разработчикам и распространителям такого кодирования.
А скачанный djvu, сделанный очевидно некачественно, можно, значит, выкинуть? Книжки у меня нет, к сожалению.


Т.е. всем кто делает djvu-книги оторвать руки и отобрать сканеры. А дальше ЧТО???
DJVU - нормальный формат для кодирования книг. По-мне, так  самый лучший на сегодня (хотя уже и старый). А то что книжка плохо сделана, так нет проблем. Хочешь сделать хорошо-сделай сам. А как сделаете, поймёте, чтобы хорошо сделать djvu-книжку требуются усилия и время.

А то что интернет завален djvu-книгами плохого качества-факт. Можно плеваться по этому поводу (сам так иногда делаю). Но нужно и понимать, основную массу ключевых/известных  книг загнали в djvu лет 8-10 назад. Тогда, делали как умели, и размер в мегабайтах стоял более остро, и такое неважное качество встречали на ура. 
А сейчас ... есть варианты: 
1-продолжать плеваться.
2-сказать спасибо тем, кто сделал когда то книги (других то нет).
3-ждать когда кто то сделает лучше.
4-сделать самому.
Наверх
 

Сложно отбинаризировать черную перемычку на белой бумаге, особенно если её там нет.
 
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 4869
Екатеринбург
Пол: male
Re: Сканирование с искажением? Такое встречается?
Ответ #8 - 20.02.2012 :: 14:01:59
 
"Каждый выбирает для себя" (с) Левитанский
и давайте закончим, если никто не против.

update:
если кто-нибудь возьмётся за обработку, я поищу эту "плохую" книжку Улыбка
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
pohorsky
Патриарх
*****
Вне Форума


Подключайтесь к проекту
"Вся МРБ"!!!

Сообщений: 5584
Москва
Пол: male
Re: Сканирование с искажением? Такое встречается?
Ответ #9 - 20.02.2012 :: 14:16:54
 
AAW писал(а) 20.02.2012 :: 14:01:59:
если кто-нибудь возьмётся за обработку, я поищу эту "плохую" книжку


Я возьмусь.
Наверх
 
 
IP записан
 
Alex55
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 138
Москва
Пол: male
Re: Сканирование с искажением? Такое встречается?
Ответ #10 - 20.02.2012 :: 14:20:47
 
AAW писал(а) 20.02.2012 :: 14:01:59:
"Каждый выбирает для себя" (с) Левитанский
Невпопад цитата.
AlVaKo писал(а) 20.02.2012 :: 13:48:49:
Т.е. всем кто делает djvu-книги оторвать руки и отобрать сканеры. А дальше ЧТО???...
Дорогие друзья! Если вы все дружно не считаете распространение плохих копий проблемой, то мне к сказанному добавить нечего.
А вот про умение некоторых здешних собеседников вычитывать в сообщениях такое, чего в них не было, мне придётся констатировать, что я это не могу объяснить никакой заботой о добре.
Не удивлюсь, если кто-нибудь из вас скажет, что я предлагал за чтение djvu-книг выкалывать глаза.
Заранее отвечаю: я этого не предлагал. Во всяком случае, сразу оба глаза. Не зверь же я в конце концов.
PS
Впопад была бы такая строка из А.Лифшица:
"Не будите мою совесть, она может покусать"
Наверх
 
WWW  
IP записан
 
Alex55
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 138
Москва
Пол: male
Re: Сканирование с искажением? Такое встречается?
Ответ #11 - 20.02.2012 :: 14:29:42
 
pohorsky писал(а) 20.02.2012 :: 14:16:54:
Я возьмусь.
Если будет хороший скан, я возьмусь за перевод в HTML. Только в фоновом режиме.
Наверх
 
WWW  
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 4869
Екатеринбург
Пол: male
Re: Сканирование с искажением? Такое встречается?
Ответ #12 - 20.02.2012 :: 16:07:53
 
pohorsky писал(а) 20.02.2012 :: 14:16:54:
Я возьмусь

ОК, я поставлю в планы на поиск. Примерно через неделю будет ясно, нашлась или нет.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
bolega
Патриарх
*****
Вне Форума



Сообщений: 1031
Re: Сканирование с искажением? Такое встречается?
Ответ #13 - 20.02.2012 :: 17:30:43
 
Неужели кому-то нужна книга по химии в html?
Наверх
 
 
IP записан
 
Jeffry
Постоялец
**
Вне Форума


Привет всем!

Сообщений: 76
Re: Сканирование с искажением? Такое встречается?
Ответ #14 - 20.02.2012 :: 17:44:30
 
Инь-проблема в djvu известна уже лет 10.   Это результат сканирования с недостаточно малым dpi, после преобразования в djvu - проблема уже не устранима.
Таких книг много в сети.
Оба тома есть у меня, найду время - отсканирую.   Сканер - на работе, но на работе время для сканирования найти можно не всегда.   В книгах Некрасова много мелкого шрифта - сканить надо с 400 dpi (300 dpi - мало).
Книги крупного формата - в разворот не сканируются.
К тому же бумага от времени заметно пожелтела, хотя контраст печати высокий.   Подождите - где-то к маю сделаю.
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 4869
Екатеринбург
Пол: male
Re: Сканирование с искажением? Такое встречается?
Ответ #15 - 20.02.2012 :: 17:45:48
 
ну а почему нет? Если формулы выверены, то html прекрасен. Жмётся в архив, занимает мало места, универсален по доступу (просмотру).
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 4869
Екатеринбург
Пол: male
Re: Сканирование с искажением? Такое встречается?
Ответ #16 - 20.02.2012 :: 17:47:42
 
Jeffry писал(а) 20.02.2012 :: 17:44:30:
В книгах Некрасова много мелкого шрифта - сканить надо с 400 dpi

Да я посканю 600, лишь бы нашлась. Чего уж, pohorsky если взялся делать - может через 10 дней "закроем тему" Подмигивание
А предыдущее моё сообщение было про html
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
bolega
Патриарх
*****
Вне Форума



Сообщений: 1031
Re: Сканирование с искажением? Такое встречается?
Ответ #17 - 20.02.2012 :: 18:25:41
 
AAW писал(а) 20.02.2012 :: 17:45:48:
ну а почему нет? Если формулы выверены, то html прекрасен.

Вы уверены, что эти два тома (там наверно страниц 600-800) нормально выверят?
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 4869
Екатеринбург
Пол: male
Re: Сканирование с искажением? Такое встречается?
Ответ #18 - 20.02.2012 :: 18:38:45
 
Это отдельный вопрос. не про "html теоретически", о котором я выше писал (вы ведь тоже спроcили про людей, а не про перевод в html). Я-то вообще ни в чём и ни в ком не уверен на 100%, даже себе обычно даю 98-99%. "Мало ли", думаю Улыбка
Конечно, чем больше переводов информации из формата в формат, тем выше вероятность ошибок, именно поэтому я ратую за djvu и высококачественную обработку силами "понимающих дело" людей. Которые ляпов типа "инь" не допустят, не смогут по своей природе.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
bolega
Патриарх
*****
Вне Форума



Сообщений: 1031
Re: Сканирование с искажением? Такое встречается?
Ответ #19 - 20.02.2012 :: 18:42:32
 
Про людей конечно  Улыбка
Более того, если будут ошибки, будем руки отрывать  Смех
Наверх
 
 
IP записан
 
Dmitry7
Модератор
*****
Вне Форума


Соберем Серии "НВЖНиТ"!

Сообщений: 5526
Санкт-Петербург
Пол: male
Re: Сканирование с искажением? Такое встречается?
Ответ #20 - 20.02.2012 :: 18:52:21
 
Alex55 писал(а) 20.02.2012 :: 08:16:31:
Не нашёл на форуме раздела по технике сканирования, поэтому свой вопрос помещаю в данном разделе.

Вы не очень хорошо искали, раздел такой давно есть, и я Ваше сообщение сюда и перенес

Хотя, как кажется, с этой проблемой можно было в подраздел "Создание электронных книг"
Наверх
 

"Если хочешь сделать что-то хорошо, сделай это сам!"
332371574  
IP записан
 
Dmitry7
Модератор
*****
Вне Форума


Соберем Серии "НВЖНиТ"!

Сообщений: 5526
Санкт-Петербург
Пол: male
Re: Сканирование с искажением? Такое встречается?
Ответ #21 - 20.02.2012 :: 18:54:23
 

о проблеме "инь" или "инь-янь" писали здесь лет 6 назад:

http://publ.lib.ru/cgi/forum/YaBB.pl?num=1150524115
Наверх
 

"Если хочешь сделать что-то хорошо, сделай это сам!"
332371574  
IP записан
 
Dmitry7
Модератор
*****
Вне Форума


Соберем Серии "НВЖНиТ"!

Сообщений: 5526
Санкт-Петербург
Пол: male
Re: Сканирование с искажением? Такое встречается?
Ответ #22 - 20.02.2012 :: 19:00:00
 
AlVaKo писал(а) 20.02.2012 :: 13:48:49:
А сейчас ... есть варианты: 

3-ждать когда кто то сделает лучше.
4-сделать самому.

вот эти варианты, имхо, самые лучшие, особенно  4-й
Наверх
 

"Если хочешь сделать что-то хорошо, сделай это сам!"
332371574  
IP записан
 
AlVaKo
Активист
***
Вне Форума



Сообщений: 330
Алма-Ата
Пол: male
Re: Сканирование с искажением? Такое встречается?
Ответ #23 - 20.02.2012 :: 19:14:45
 
Тогда у меня несколько издевательское предложение...  Улыбка

Пускай AAW даст сырые сканы Alex55. И пусть Alex55 сделает хорошую djvu-книжку по химии.
Хочется посмотреть, проснется ли совесть и чего у кого кусать начнет. А так глядишь и ещё один обработчик появиться.
Наверх
 

Сложно отбинаризировать черную перемычку на белой бумаге, особенно если её там нет.
 
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 4869
Екатеринбург
Пол: male
Re: Сканирование с искажением? Такое встречается?
Ответ #24 - 20.02.2012 :: 19:21:25
 
AlVaKo писал(а) 20.02.2012 :: 19:14:45:
ещё один обработчик

собственно, у меня-то тоже второе дно в этой переписке - чтоб нашего полку прибыло Подмигивание
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
AlVaKo
Активист
***
Вне Форума



Сообщений: 330
Алма-Ата
Пол: male
Re: Сканирование с искажением? Такое встречается?
Ответ #25 - 20.02.2012 :: 19:56:41
 
Полк ни как не набирается. Alex55 похоже не понимает, что проблема обилия плохих djvu-книг
не в распространителях. И даже не в неумелых обработчиках. А просто в малом количестве обработчиков...любых.  Нет нужного количества, переходящего в качество.

Наверх
 

Сложно отбинаризировать черную перемычку на белой бумаге, особенно если её там нет.
 
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 4869
Екатеринбург
Пол: male
Re: Сканирование с искажением? Такое встречается?
Ответ #26 - 20.02.2012 :: 20:06:10
 
"профессионалов всегда мало". Известное дело. Было бы куда расти - подтянулись бы и остальные. А лучше наших гуру сделать уже нельзя, поэтому вероятно Alex55 и предлагает расширить деятельность в сторону качественного доступа к информации. Чтоб на освободившиеся места подтягивался второй эшелон.
(и я об этом думаю давно... но дальше дум не иду)
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
Alex55
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 138
Москва
Пол: male
Re: Сканирование с искажением? Такое встречается?
Ответ #27 - 20.02.2012 :: 23:03:11
 
bolega писал(а) 20.02.2012 :: 18:42:32:
Про людей конечно  Улыбка
Более того, если будут ошибки, будем руки отрывать  Смех
Ошибка программиста (алгоритмиста) такого рода, как описана в теме, весьма своеобразна. Почему бы не предположить, что этим же путём шли и программисты упаковщиков видео, в результате старые фильмы распространяются с изуродованным до невозможности звуком.
Когда делом воспроизводства информации перестают заниматься государственные учреждения, когда государство не стандартизирует форматы, не поддерживает профессионализм в этих вопросах, то даже идеологическая цензура может выглядеть просто как низкое качество любительского труда.
Наверх
 
WWW  
IP записан
 
Alex55
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 138
Москва
Пол: male
Re: Сканирование с искажением? Такое встречается?
Ответ #28 - 20.02.2012 :: 23:20:30
 
AlVaKo писал(а) 20.02.2012 :: 19:14:45:
Тогда у меня несколько издевательское предложение...  Улыбка
Это Ваша личная форма извиняться - на будущее? Госпадя...
AlVaKo писал(а) 20.02.2012 :: 19:14:45:
Пускай AAW даст сырые сканы Alex55. И пусть Alex55 сделает хорошую djvu-книжку по химии.
Хочется посмотреть, проснется ли совесть и чего у кого кусать начнет. А так глядишь и ещё один обработчик появиться.
Я не буду делать хороших djvu-книжек. Во-первых, я не поклонник подхода "тебе нужно - ты и делай" в отношении книг. К этому принуждает нынешняя обстановка, приходится иногда делать.
И раз уж делаешь что-либо, полезное не только себе, то стараешься сделать общим достоянием, не ниже приемлемого уровня. И в таких делах я - за координацию.
Во-вторых, я принципиально, как алгоритмист, осуждаю нетекстовые форматы текстовых документов, считаю их излишними.
Как исключение - куда ни шло.
Наверх
 
WWW  
IP записан
 
Alex55
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 138
Москва
Пол: male
Re: Сканирование с искажением? Такое встречается?
Ответ #29 - 20.02.2012 :: 23:48:26
 
Dmitry7 писал(а) 20.02.2012 :: 18:52:21:
Вы не очень хорошо искали, раздел такой давно есть, и я Ваше сообщение сюда и перенес...
Прошу извинить, я искал действительно плохо (не из вершины дерева форумов). Больше так не буду Улыбка
Наверх
 
WWW  
IP записан
 
Страниц: 1 2 3 4
Послать Тему Печать