OCR форумы Добро пожаловать, Гость. Пожалуйста, выберите Вход или Регистрация
Всем привет!
Hi all!
 
  ГлавнаяСправкаПоискВходРегистрация Администратор Библиотека  
 
Переключение на Главную Страницу Страниц: 1
Послать Тему Печать
Размытые края страниц. (Прочитано 1139 раз)
zvezdochiot
Постоялец
**
Вне Форума



Сообщений: 159
Москва
Пол: male
Размытые края страниц.
24.03.2023 :: 12:44:46
 
Есть отсканированные страницы. Из-за неплотного наложения страниц на стекло сканера по краям (углам) области достаточно сильного размытия. Все испробованные методы порога дают "чорт пойми что". Повышение резкости и нерезкая маска не справляются. Понимаю, что материл надо пересканировать, но возможности нет. Стандартные (глобальные) деблюринги (например, Deblurring) дают негожий результат.

Кто сумел хоть чего то добиться в вопросе борьбы с размытием по краям страниц? И как?

...
Наверх
« Последняя редакция: 24.03.2023 :: 12:52:22 от zvezdochiot »  

Keep it simple, stupid
WWW  
IP записан
 
AAW
Патриарх
*****
На Форуме


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5432
Екатеринбург
Пол: male
Re: Размытые края страниц.
Ответ #1 - 24.03.2023 :: 15:52:53
 
zvezdochiot писал(а) 24.03.2023 :: 12:44:46:
Кто сумел хоть чего то добиться в вопросе борьбы с размытием по краям страниц? И как?

В таких тяжёлых случаях помогает единственный метод.
Бросить это бесполезное занятие.

Вы ещё поспрашивайте, кто и как научился читать газету, глядя на неё за полкилометра без какой-либо оптики. Ну, можно поискать второго человека, который вам её почитает по телефону. Есть же здравый смысл и фундаментальные физические ограничения. Типа Шеннона.

Говорят, помогает дрессировка нейросети. Но ни единого практически пригодного результата я не видел никогда. В смысле работающего хотя бы в демо-режиме кода. Исключительно реклама на заранее подобранных примерах. Так что строго поиск второго экземпляра и перескан.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
zvezdochiot
Постоялец
**
Вне Форума



Сообщений: 159
Москва
Пол: male
Re: Размытые края страниц.
Ответ #2 - 24.03.2023 :: 16:39:10
 
AAW писал(а) 24.03.2023 :: 15:52:53:
Бросить это бесполезное занятие.

Мы уже не раз и не два и даже не десяток раз говорили об " бесполезное занятие" с Вадимом. И я ещё раз, но уже не Вадиму повторю: Мои "эксперименты" никогда и ни разу не являются бесполезными. Даже ежели я не получаю решения, я всё-равно получаю что то взамен. Мой вопрос именно таков: ежели нет решения, то что взамен? Ваш вариант к несчастью не имеет будущего.
Наверх
 

Keep it simple, stupid
WWW  
IP записан
 
Lykas
Патриарх
*****
Вне Форума


Всем привет!

Сообщений: 1073
Re: Размытые края страниц.
Ответ #3 - 24.03.2023 :: 17:19:32
 
zvezdochiot писал(а) 24.03.2023 :: 12:44:46:
Есть отсканированные страницы. Из-за неплотного наложения страниц на стекло сканера по краям (углам) области достаточно сильного размытия. Все испробованные методы порога дают "чорт пойми что". Повышение резкости и нерезкая маска не справляются. Понимаю, что материл надо пересканировать, но возможности нет. Стандартные (глобальные) деблюринги (например, Deblurring) дают негожий результат.

Кто сумел хоть чего то добиться в вопросе борьбы с размытием по краям страниц? И как?

https://i121.fastpic.org/big/2023/0324/6a/90488abdaf62544925f297dc6095726a.png

Не сканируйте на МФУ или меняйте сканер. Сейчас книжный Оптибук не шибко отличается по цене от простого планшетника. 
То что отсканировано с таким качеством сносите нафиг. Больше времени потратите на то что-бы сделать из дерьма-конфетку. Будет возможность - сделаете нормальные сканы.
Перебираю то что сканировалось лет пятнадцать назад - большую часть можно просто выкинуть и пересканировать заново.
ЗЫ если надо выдрать текст, то попробуйте распознать и пропустить через программу правилку текста. Название не помню, разработчик выпускал еще редактор Иероглиф.
ЗЫ нашел - AfterScan
Наверх
 
 
IP записан
 
zvezdochiot
Постоялец
**
Вне Форума



Сообщений: 159
Москва
Пол: male
Re: Размытые края страниц.
Ответ #4 - 24.03.2023 :: 17:49:25
 
Lykas писал(а) 24.03.2023 :: 17:19:32:
Больше времени потратите

Я не против потратить это время не для этих сканов, а чтобы уметь.
Lykas писал(а) 24.03.2023 :: 17:19:32:
Будет возможность - сделаете нормальные сканы.

Нет такой возможности и не будет.
Lykas писал(а) 24.03.2023 :: 17:19:32:
распознать и пропустить через программу правилку текста.

Больше интересуют модели нейросетей, обученные выправлять (даже если немного) буквы текста. Пока таких не встречал. Все помешаны на upscale. То есть интересуют те же самые OCR, но с обратной связью на само изображение. А такого даже FR не имеет.

Наверх
 

Keep it simple, stupid
WWW  
IP записан
 
AAW
Патриарх
*****
На Форуме


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5432
Екатеринбург
Пол: male
Re: Размытые края страниц.
Ответ #5 - 24.03.2023 :: 18:52:57
 
zvezdochiot писал(а) 24.03.2023 :: 17:49:25:
но с обратной связью на само изображение

Года четыре назад я наткнулся на теоретическое описание обратной коррекции размытости, в какой-то книжке по оптике для космоса: мол, если известно, что именно делает линза, как искажает, то можно применив к конечному результату (картинке) математический аппарат этого "как искажает" полностью восстановить исходное изображение. Вроде пришел я к этой книжке  через какую-то статью на хабре. Но на практике я не сумел даже начать пробовать применять - надо было изучать что-то типа маткада, и неслабо так попахать. Как мне подсказывали в личке, надо мало того что описать оптику сканера (конкретного, а это нелегко), так надо ещё описать как именно гнулся конкретный лист бумаги, а значит написать онлайн-редактор, описывающий изгиб. Или как-то выёживаться с попыткой авторассчитать изгиб по внешнему виду изображения/букв. В общем, я совсем не математик, и желания потратить пяток лет на самообразование не возникло. Проще найти хороший сканер и второй оригинал.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
zvezdochiot
Постоялец
**
Вне Форума



Сообщений: 159
Москва
Пол: male
Re: Размытые края страниц.
Ответ #6 - 24.03.2023 :: 20:25:34
 
AAW писал(а) 24.03.2023 :: 18:52:57:
Но на практике я не сумел даже начать пробовать применять - надо было изучать что-то типа маткада, и неслабо так попахать.

В стартовом сообщении я дал ссылку на прогу, которая без всяких выпендрёжей делает именно то, что вы описали. Но! С изображением размытым полностью и равномерно. Но никак не локальные участки (тайловая модель).

Для особо страждущих, скомпилировал под винду: Я.диск: Deblurring-win32.zip. Насколько рабочая? Не знаю. Проверить не могу.
! ПРЕДУПРЕЖДЕНИЕ !: Это CLI. Для тех, кто не умеет CLI - не трогать и не спрашивать.

AAW писал(а) 24.03.2023 :: 18:52:57:
Или как-то выёживаться с попыткой авторассчитать изгиб по внешнему виду изображения/букв.

OpenCV справится. Но проще применить тайлы (плитку).
Наверх
« Последняя редакция: 24.03.2023 :: 21:51:43 от zvezdochiot »  

Keep it simple, stupid
WWW  
IP записан
 
zvezdochiot
Постоялец
**
Вне Форума



Сообщений: 159
Москва
Пол: male
Re: Размытые края страниц.
Ответ #7 - 25.03.2023 :: 10:17:57
 
zvezdochiot писал(а) 24.03.2023 :: 20:25:34:
Но никак не локальные участки (тайловая модель).

"Долгожданная" тайловая модель: GIT: cpuimage/Deblurring #2. Сборка под винду в конце второго сообщения. Насколько рабочая? Не знаю. Проверить не могу.
! ПРЕДУПРЕЖДЕНИЕ !: Это CLI. Для тех, кто не умеет CLI - не трогать и не спрашивать.

PS: "Слегка" долгая и совсем не шустрая, но мне главное уметь.

Диагноз: Такой брак даже с тайлами 256х256 данный деблюр не смог побороть (не смог подобрать ядро == kernel):
...
Наверх
« Последняя редакция: 25.03.2023 :: 20:22:38 от zvezdochiot »  

Keep it simple, stupid
WWW  
IP записан
 
zvezdochiot
Постоялец
**
Вне Форума



Сообщений: 159
Москва
Пол: male
Re: Размытые края страниц.
Ответ #8 - 15.04.2023 :: 00:31:05
 
zvezdochiot писал(а) 25.03.2023 :: 10:17:57:
Диагноз: Такой брак...

Чудес конечно не бывает, но встаёт тогда вопрос: Как же применить порог к такому изображению и получить хоть сколько нибудь вменяемый результат?

О чём собственно речь?

Применение к изображению первого поста BiMod/Otsu:

...

Применение к изображению первого поста Sauvola:

...

Хмм. А что-нибудь более вменяемое есть? Есть. Одна из разновидностей гибридного порога:

1) Определить толщину штрихов литер (кол-во "Дилатаций" * 2)
2) Создать две копии слоя
3) К верхнему слою применить "Гауссово размывание" радиусом, определённым в пункте 1.
4) Наложить размытую картинку в режиме "Делить" на следующий слой и объединить их
5) Применить "Цвет > Выравнивание" к полученной "контурной карте".
6) Наложить результат в режиме "Перекрытие" и слить слои.
7) К результату уже применить порог BiMod/Otsu, либо ручной.

...
Наверх
« Последняя редакция: 15.04.2023 :: 00:37:22 от zvezdochiot »  

Keep it simple, stupid
WWW  
IP записан
 
Переключение на Главную Страницу Страниц: 1
Послать Тему Печать