OCR форумы Добро пожаловать, Гость. Пожалуйста, выберите Вход или Регистрация
Всем привет!
Hi all!
 
  ГлавнаяСправкаПоискВходРегистрация Администратор Библиотека  
 
Страниц: 1 ... 10 11 12 13 14 
Послать Тему Печать
Вопросы по программе ScanKromsator (Прочитано 170946 раз)
pohorsky
Патриарх
*****
На Форуме


Подключайтесь к проекту
"Вся МРБ"!!!

Сообщений: 5898
Москва
Пол: male
Re: Вопросы по программе ScanKromsator
Ответ #330 - 28.05.2022 :: 17:31:59
 
bolega писал(а) 28.05.2022 :: 17:09:12:
В FR сохранить проект.
В папку data внутри проекта


Что то я ни FR11 ни FR12 не вижу в опциях "сохранить проект". Есть только "сохранить документ FR"
Или я бестолковый такой...
Наверх
 
 
IP записан
 
pohorsky
Патриарх
*****
На Форуме


Подключайтесь к проекту
"Вся МРБ"!!!

Сообщений: 5898
Москва
Пол: male
Re: Вопросы по программе ScanKromsator
Ответ #331 - 28.05.2022 :: 17:42:41
 
pohorsky писал(а) 28.05.2022 :: 17:31:59:
Что то я ни FR11 ни FR12 не вижу в опциях "сохранить проект". Есть только "сохранить документ FR"
Или я бестолковый такой...


Да, кажется речь идет о папке, которая получается после сохранения  "сохранить документ FR"

Поеду дальше по этой теме. Спасибо!
Наверх
 
 
IP записан
 
Dmitry7
Модератор
*****
Вне Форума


Соберем Серии "НВЖНиТ"!

Сообщений: 5871
Санкт-Петербург
Пол: male
Re: Вопросы по программе ScanKromsator
Ответ #332 - 28.05.2022 :: 21:37:16
 

Может кто-нибудь пояснить простым языком, пошагово, как создать в СК (изнутри) djvu с распознанным текстом?
Не смог разобраться в целом.
Интеграция СК с FR (и вообще с OCR в СК) для меня - тёмный лес Печаль
Видимо, что-то базовое упустил с самого начала своего использования СК.

Для создания текстового слоя всегда отдельно пользовался программкой djvuOCR + FR8 (после изготовления книжки в СК), и этого было достаточно (?). Есть ли смысл заморачиваться с FR12, что это даёт принципиального отличного?
Наверх
« Последняя редакция: 28.05.2022 :: 21:44:49 от Dmitry7 »  

"Если хочешь сделать что-то хорошо, сделай это сам!"
332371574  
IP записан
 
AAW
Патриарх
*****
На Форуме


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5432
Екатеринбург
Пол: male
Re: Вопросы по программе ScanKromsator
Ответ #333 - 29.05.2022 :: 04:28:10
 
Dmitry7 писал(а) 28.05.2022 :: 21:37:16:
как создать в СК (изнутри) djvu с распознанным текстом

этого нет в СК

ocr-фичи нужны для правки глифов и удаления марашек. А слой текста вставлять по-прежнему через djvuOCR.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
Dmitry7
Модератор
*****
Вне Форума


Соберем Серии "НВЖНиТ"!

Сообщений: 5871
Санкт-Петербург
Пол: male
Re: Вопросы по программе ScanKromsator
Ответ #334 - 29.05.2022 :: 06:35:38
 
AAW писал(а) 29.05.2022 :: 04:28:10:
этого нет в СК
ocr-фичи нужны для правки глифов и удаления марашек. А слой текста вставлять по-прежнему через djvuOCR.

Понятно, спасибо
Наверх
 

"Если хочешь сделать что-то хорошо, сделай это сам!"
332371574  
IP записан
 
bolega
Патриарх
*****
Вне Форума



Сообщений: 1104
Re: Вопросы по программе ScanKromsator
Ответ #335 - 29.05.2022 :: 08:45:25
 
В принципе наверно можно ocr теперь добавить и в djvu
Наверх
 
 
IP записан
 
bolega
Патриарх
*****
Вне Форума



Сообщений: 1104
Re: Вопросы по программе ScanKromsator
Ответ #336 - 29.05.2022 :: 11:06:32
 
Цитата:
Интеграция СК с FR (и вообще с OCR в СК) для меня - тёмный лес Печаль


Это вообще характерная ситуация для каждой новой версии. Десятки писем в ЛЯ с просьбой срочно поделиться новейшей версией, "по зарез нужно". А потом "я еще видео не смотрел, не досуг было", "разбираться нет времени", "а зачем нужен ocr?"  и т.п. Спрашивается, а зачем многим вообще новая версия  Озадачен
Наверх
 
 
IP записан
 
krestik
Гуру
****
Вне Форума


Всем привет!

Сообщений: 824
Re: Вопросы по программе ScanKromsator
Ответ #337 - 29.05.2022 :: 13:51:39
 
https://drive.google.com/file/d/1x0o6JTVPkiYcZDf-OWjCiusRwL6N38Ca/view?usp=shari
ng

Записал к чему пришел я, может кому-то будет полезно, а может еще больше запутает  Улыбка
Наверх
 
 
IP записан
 
Dmitry7
Модератор
*****
Вне Форума


Соберем Серии "НВЖНиТ"!

Сообщений: 5871
Санкт-Петербург
Пол: male
Re: Вопросы по программе ScanKromsator
Ответ #338 - 29.05.2022 :: 14:33:25
 
bolega писал(а) 29.05.2022 :: 08:45:25:
В принципе наверно можно ocr теперь добавить и в djvu

Вы что здесь имеете в виду? Можете уточнить?
Наверх
 

"Если хочешь сделать что-то хорошо, сделай это сам!"
332371574  
IP записан
 
Dmitry7
Модератор
*****
Вне Форума


Соберем Серии "НВЖНиТ"!

Сообщений: 5871
Санкт-Петербург
Пол: male
Re: Вопросы по программе ScanKromsator
Ответ #339 - 29.05.2022 :: 14:33:38
 
krestik писал(а) 29.05.2022 :: 13:51:39:
https://drive.google.com/file/d/1x0o6JTVPkiYcZDf-OWjCiusRwL6N38C
a/view?usp=sharing

Записал к чему пришел я, может кому-то будет полезно, а может еще больше запутает  Улыбка

спасибо! полезно
Наверх
 

"Если хочешь сделать что-то хорошо, сделай это сам!"
332371574  
IP записан
 
Dmitry7
Модератор
*****
Вне Форума


Соберем Серии "НВЖНиТ"!

Сообщений: 5871
Санкт-Петербург
Пол: male
Re: Вопросы по программе ScanKromsator
Ответ #340 - 29.05.2022 :: 18:00:26
 


А где можно менять размер марашек, удаляемых без OCR ?

Или такой возможности пока нет? А какой размер выставлен по умолчанию? Другими словами, что сейчас является отличительным признаком марашки в алгоритме?



Наверх
 

"Если хочешь сделать что-то хорошо, сделай это сам!"
332371574  
IP записан
 
AAW
Патриарх
*****
На Форуме


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5432
Екатеринбург
Пол: male
Re: Вопросы по программе ScanKromsator
Ответ #341 - 29.05.2022 :: 21:11:18
 
Dmitry7 писал(а) 29.05.2022 :: 18:00:26:
Другими словами, что сейчас является отличительным признаком марашки в алгоритме?

по-моему, тут:

...
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
Dmitry7
Модератор
*****
Вне Форума


Соберем Серии "НВЖНиТ"!

Сообщений: 5871
Санкт-Петербург
Пол: male
Re: Вопросы по программе ScanKromsator
Ответ #342 - 29.05.2022 :: 22:09:51
 
AAW писал(а) 29.05.2022 :: 21:11:18:
по-моему, тут:

Но там только размер спеклов регулируется, на размер убираемых марашек не влияет

или это в квадратике "Strong connected speckles" ?
Наверх
 

"Если хочешь сделать что-то хорошо, сделай это сам!"
332371574  
IP записан
 
AAW
Патриарх
*****
На Форуме


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5432
Екатеринбург
Пол: male
Re: Вопросы по программе ScanKromsator
Ответ #343 - 30.05.2022 :: 06:12:19
 
нет, не в квадратике.
у меня влияло, я задал там 40 вместо 24 рекомендованных, и все палочки у "ы" пропали Улыбка
точнее, начали опознаваться как марашки.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
Dmitry7
Модератор
*****
Вне Форума


Соберем Серии "НВЖНиТ"!

Сообщений: 5871
Санкт-Петербург
Пол: male
Re: Вопросы по программе ScanKromsator
Ответ #344 - 30.05.2022 :: 19:52:30
 
AAW писал(а) 30.05.2022 :: 06:12:19:
нет, не в квадратике.
у меня влияло, я задал там 40 вместо 24 рекомендованных, и все палочки у "ы" пропали Улыбка
точнее, начали опознаваться как марашки.

Т.е. марашки - это просто особый тип спекла, у которого ширина в несколько раз меньше высоты?
Наверх
 

"Если хочешь сделать что-то хорошо, сделай это сам!"
332371574  
IP записан
 
bolega
Патриарх
*****
Вне Форума



Сообщений: 1104
Re: Вопросы по программе ScanKromsator
Ответ #345 - 05.06.2022 :: 07:45:35
 
Dmitry7 писал(а) 30.05.2022 :: 19:52:30:
Т.е. марашки - это просто особый тип спекла, у которого ширина в несколько раз меньше высоты?

В принципе да.
А в чем была ваша проблема? Какие-то марашки не подсвечивались и вы хотите подкорректировать допустимые размеры? Абсолютные размеры марашек зашиты в код СК и зависят от dpi. Но их можно увеличить или уменьшить на заданное кол-во пикселей, VR, options, на закладке OCR опция marashki correction. Но меняйте осторожно, особенно ширину.
Наверх
 
 
IP записан
 
bolega
Патриарх
*****
Вне Форума



Сообщений: 1104
Re: Вопросы по программе ScanKromsator
Ответ #346 - 05.06.2022 :: 07:51:43
 
На руборде не могу писать, отвечу niccolo тут: никаких пустых страниц после импорта СК нет, просто во всех зонах (туда попал текст) включилась раскраска белым цветом (почему так, надо разбираться). Если ее убрать, все станет видно.
Есть и более простой способ для этого pdf: при его импорте в опциях импорта поставить галку на do not use zones и отключить галку на use original pdf size
Наверх
 
 
IP записан
 
Dmitry7
Модератор
*****
Вне Форума


Соберем Серии "НВЖНиТ"!

Сообщений: 5871
Санкт-Петербург
Пол: male
Re: Вопросы по программе ScanKromsator
Ответ #347 - 05.06.2022 :: 15:19:40
 
bolega писал(а) 05.06.2022 :: 07:45:35:
Какие-то марашки не подсвечивались и вы хотите подкорректировать допустимые размеры? Абсолютные размеры марашек зашиты в код СК и зависят от dpi. Но их можно увеличить или уменьшить на заданное кол-во пикселей, VR, options, на закладке OCR опция marashki correction. Но меняйте осторожно, особенно ширину.

Да, это имел в виду.

Спасибо, понятно! (Я думал, там абсолютные размеры задаются, а не на сколько увеличить - кстати, возможности уменьшить не нашел, можно только положительные числа задавать?)

А как расшифровывается "Touching mode" и что можно сделать путем изменения цифры в этой опции?


Наверх
 

"Если хочешь сделать что-то хорошо, сделай это сам!"
332371574  
IP записан
 
pohorsky
Патриарх
*****
На Форуме


Подключайтесь к проекту
"Вся МРБ"!!!

Сообщений: 5898
Москва
Пол: male
Re: Вопросы по программе ScanKromsator
Ответ #348 - 09.06.2022 :: 06:46:45
 
Вопрос ко всем:
Создал библиотеку глифов. Хочу её использовать для другой книги с таким же шрифтом, но немного другого размера. Как поступить правильнее?
Наверх
 
 
IP записан
 
bolega
Патриарх
*****
Вне Форума



Сообщений: 1104
Re: Вопросы по программе ScanKromsator
Ответ #349 - 09.06.2022 :: 07:52:28
 
Dmitry7 писал(а) 05.06.2022 :: 15:19:40:
А как расшифровывается "Touching mode" и что можно сделать путем изменения цифры в этой опции?

Это экспериментальные опции. Их не нужно трогать.
Touching mode - это режим, когда удаляются спеклы/марашки, касающиеся периметра наложенного глифа. Если глиф тоньше (аккуратнее) реальной буквы, то после вставки вокруг него образуется изолированный мусор, вот его СК автоматически и подчищает, если включен данный режим.
Наверх
 
 
IP записан
 
bolega
Патриарх
*****
Вне Форума



Сообщений: 1104
Re: Вопросы по программе ScanKromsator
Ответ #350 - 09.06.2022 :: 07:54:16
 
pohorsky писал(а) 09.06.2022 :: 06:46:45:
Вопрос ко всем:
Создал библиотеку глифов. Хочу её использовать для другой книги с таким же шрифтом, но немного другого размера. Как поступить правильнее?

В таком случае я набираю по новой из новой книги.
А на сколько разница?
Наверх
 
 
IP записан
 
pohorsky
Патриарх
*****
На Форуме


Подключайтесь к проекту
"Вся МРБ"!!!

Сообщений: 5898
Москва
Пол: male
Re: Вопросы по программе ScanKromsator
Ответ #351 - 09.06.2022 :: 07:57:28
 
bolega писал(а) 09.06.2022 :: 07:54:16:
В таком случае я набираю по новой из новой книги.
А на сколько разница?


Максимум процентов на 20, больше или меньше...
Наверх
 
 
IP записан
 
bolega
Патриарх
*****
Вне Форума



Сообщений: 1104
Re: Вопросы по программе ScanKromsator
Ответ #352 - 09.06.2022 :: 08:01:21
 
Я в принципе могу добавить команду увеличения размеров глифа внутри библиотеки, но не уверен что upsample ч/б небольшой картинки глифа не внесет артефакты
Наверх
 
 
IP записан
 
pohorsky
Патриарх
*****
На Форуме


Подключайтесь к проекту
"Вся МРБ"!!!

Сообщений: 5898
Москва
Пол: male
Re: Вопросы по программе ScanKromsator
Ответ #353 - 09.06.2022 :: 08:18:30
 
bolega писал(а) 09.06.2022 :: 08:01:21:
Я в принципе могу добавить команду увеличения размеров глифа внутри библиотеки, но не уверен что upsample ч/б небольшой картинки глифа не внесет артефакты


Было бы не плохо, если получится
Наверх
 
 
IP записан
 
pohorsky
Патриарх
*****
На Форуме


Подключайтесь к проекту
"Вся МРБ"!!!

Сообщений: 5898
Москва
Пол: male
Re: Вопросы по программе ScanKromsator
Ответ #354 - 09.06.2022 :: 08:27:38
 
bolega писал(а) 09.06.2022 :: 08:01:21:
Я в принципе могу добавить команду увеличения размеров глифа внутри библиотеки, но не уверен что upsample ч/б небольшой картинки глифа не внесет артефакты


Вдогонку: Ещё часто для того же шрифта, но жирного, нужно создавать свою библиотеку. Может, заодно, проработаете вопрос..
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
На Форуме


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5432
Екатеринбург
Пол: male
Re: Вопросы по программе ScanKromsator
Ответ #355 - 13.06.2022 :: 12:14:23
 
"есть мнение": для книг с поголовной заменой глифов ввести специальный идентификатор (логотип).

Всё-таки массовая непроконтролированная замена, которую стал предоставлять СК, может привести к не-аутентичности. То есть было два варианта е-книг: распознанные с подобранным шрифтом и дежавюированные (сканированные/бинаризованные). Появилась возможность третьего пути обработки.

допустим, что-то такое:

...

или к стандартному штампику добавить "SK 6.75 - replace glyphs"
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
krestik
Гуру
****
Вне Форума


Всем привет!

Сообщений: 824
Re: Вопросы по программе ScanKromsator
Ответ #356 - 14.06.2022 :: 17:10:55
 
Мальцев Т. - Через опыт - в науку - 1951

...

https://drive.google.com/file/d/1yDJKLhWQsQLKBMFZ-DofOInyavuYTQDu/view?usp=shari
ng

https://drive.google.com/file/d/1OBZ9M1p5lMe3Pxjo0vUtyWA8I5N6CbBF/view?usp=shari
ng

Книга в тему. Все глифы заменены, книгу после обработки прочитал и исправил ошибки! Ошибок было около 25-30, в основном буква с и плотно прилегающая к ней марашка справа распознавалась как о. Ну и как всегда н, и, п.

Вопрос для меня остаётся открытым, способен ли глаз "поймать" при прочтении книги все ошибки текста, заметил что ошибки в основном в коротких словах - или, если, но и т.д. короче от двух до пяти-шести символов. На длинных, сложных словах я старался читать медленее и внимательнее, но вопрос открытый  Улыбка

И еще, получается словари не все слова распознают, к примеру слово Если было заменено как Бсли и словарь не "распознал". Всё равно результат лично меня радует, такую книгу "вручную" обрабатывал бы еще пол года, а так 3-4 дня и fertig! Улыбка
Наверх
 
 
IP записан
 
Dmitry7
Модератор
*****
Вне Форума


Соберем Серии "НВЖНиТ"!

Сообщений: 5871
Санкт-Петербург
Пол: male
Re: Вопросы по программе ScanKromsator
Ответ #357 - 26.06.2022 :: 13:57:04
 


Режим удаления марашек иногда съедает знак "косого" деления " / ", в том числе в знаке "%".

Причем и распознавание не всегда помогает. Можно, конечно, уменьшить размер марашек в установках, но тогда много реальных марашек не удалится.

Зависит от вида шрифта, но автоматическое удаление надо применять осторожно в этом случае.
Особенно касается математических книг, и книг, где есть много знаков "%"
Наверх
 

"Если хочешь сделать что-то хорошо, сделай это сам!"
332371574  
IP записан
 
pohorsky
Патриарх
*****
На Форуме


Подключайтесь к проекту
"Вся МРБ"!!!

Сообщений: 5898
Москва
Пол: male
Re: Вопросы по программе ScanKromsator
Ответ #358 - 04.07.2022 :: 06:18:01
 
Странный эффект обнаружен в версии в sk6.75. Реставрация текста работает только на ч.б. страницах. Если в тексте есть фрагменты с другим цветом, то после операции замены цвета и выполнении Merge, реставрировать текст не удается (замена глифов скана на библиотечные не происходит).
Замена глифов скана на библиотечные не происходит и на ч.б. сканах, если библиотека создана с помощью страницы с уже измененным цветом некоторых фрагментов текста и выполнении Merge. Что то, наверное, я делаю не так...
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
На Форуме


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5432
Екатеринбург
Пол: male
Re: Вопросы по программе ScanKromsator
Ответ #359 - 24.07.2022 :: 06:27:41
 
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
Страниц: 1 ... 10 11 12 13 14 
Послать Тему Печать