OCR форумы Добро пожаловать, Гость. Пожалуйста, выберите Вход или Регистрация
Всем привет!
Hi all!
 
  ГлавнаяСправкаПоискВходРегистрация Администратор Библиотека  
 
Страниц: 1 ... 8 9 10 
Послать Тему Печать
Создание DJVU-книг (Прочитано 213779 раз)
AbsurdMan
Патриарх
*****
Вне Форума


Всем привет!

Сообщений: 1183
Москва
Пол: male
Re: Создание DJVU-книг
Ответ #270 - 22.11.2023 :: 22:11:49
 
Прошу переформатировать в дежавю:

https://cloud.mail.ru/public/HE5E/9WNAfamhM
Наверх
 
446581004  
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5471
Екатеринбург
Пол: male
Re: Создание DJVU-книг
Ответ #271 - 06.01.2024 :: 10:51:51
 
Попалась книжка со странной обработкой страниц (Кульский, Химия воды, 1983г)
https://disk.yandex.ru/d/i-5KQuCS0j51ew
Половина текста на страницах распознана, половина осталась сканированными буквами.
Кто-нибудь знает ответ, как это сделали и, главное, зачем?
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
AlVaKo
Гуру
****
Вне Форума



Сообщений: 527
Алма-Ата
Пол: male
Re: Создание DJVU-книг
Ответ #272 - 06.01.2024 :: 12:18:46
 
Зачем пытаться раскрыть секреты "мастерства" бракоделов?
Наверх
 

Сложно отбинаризировать черную перемычку на белой бумаге, особенно если её там нет.
 
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5471
Екатеринбург
Пол: male
Re: Создание DJVU-книг
Ответ #273 - 06.01.2024 :: 12:32:29
 
За "три сигма" выскочить. Расширить кругозор чтобы полнее представлять предметную область.

Например, есть такие "djvu словари", djvudic. Не словари символов, а специальные навороты к формату djvu, которые позволяют удобнее работать с книгами-словарями. Я после ознакомления с такой штучкой прям осознал, что "не боги горшки обжигают".

Может и здесь выявится что-то нестандартное.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
xyz
Гуру
****
Вне Форума


Всем привет!

Сообщений: 876
Re: Создание DJVU-книг
Ответ #274 - 06.01.2024 :: 12:37:59
 
FineReader был применён
Возможно, оригинал иначе совсем не читался.


Вот сравните тут 113 и 114 страницу:

https://catalog.libfl.ru/Bookreader/Viewer?bookID=BJVVV_1014754&view_mode=HQ#pag...
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5471
Екатеринбург
Пол: male
Re: Создание DJVU-книг
Ответ #275 - 06.01.2024 :: 13:04:03
 
в Илиаде страница целиком распознана. А в Кульском по куску страницы.

Такое ощущение что алгоритм распознавания начинал распознавать, натыкался на трудное место, типа формулы, и прекращал работу. Но я встречал, кажется, и места где на странице сначала скан, а потом ocr. Что уже ни в какие рамки не лезет. Отсюда и любопытство - а это как и зачем.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
bolega
Патриарх
*****
Вне Форума



Сообщений: 1116
Re: Создание DJVU-книг
Ответ #276 - 06.01.2024 :: 19:46:42
 
Я с таким сталкивался когда распознавал FR8. Он половину страницы тупо игнорировал, хотя там был просто текст.
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5471
Екатеринбург
Пол: male
Re: Создание DJVU-книг
Ответ #277 - 06.01.2024 :: 19:50:07
 
какие-то самые ранние версии его? Вроде потом восьмерку все хвалили и хвалят.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
bolega
Патриарх
*****
Вне Форума



Сообщений: 1116
Re: Создание DJVU-книг
Ответ #278 - 06.01.2024 :: 20:12:31
 
Да нет, самая распространенная. Хороша тем, что для нее есть djvuocr от gencho.
У меня такой косяк был на паре книг точно, причина абсолютно непонятна. Возможно, что и другие случаи были, просто никогда особо не проверял ocr-слой.
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5471
Екатеринбург
Пол: male
Re: Создание DJVU-книг
Ответ #279 - 06.01.2024 :: 20:50:45
 
то есть возможный путь такой: из ФР8 в пдф, из него в джву - ? Но я не нашёл никакой пдфки.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
bolega
Патриарх
*****
Вне Форума



Сообщений: 1116
Re: Создание DJVU-книг
Ответ #280 - 06.01.2024 :: 23:15:06
 
нет, путь обычно такой: FR8 > DjvuOCR > djvu
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5471
Екатеринбург
Пол: male
Re: Создание DJVU-книг
Ответ #281 - 07.01.2024 :: 07:01:25
 
Не понял. Я не про невидимый слой ocr говорю, я про обработку страниц. Как могло получиться вот такое:
...
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
bolega
Патриарх
*****
Вне Форума



Сообщений: 1116
Re: Создание DJVU-книг
Ответ #282 - 07.01.2024 :: 08:46:01
 
ах, да. Но гипотеза остается та же
Наверх
 
 
IP записан
 
bermuda
Новичок
*
Вне Форума


Всем привет!

Сообщений: 9
Re: Создание DJVU-книг
Ответ #283 - 09.01.2024 :: 15:52:46
 
Опасная книга. Похоже, что в ней в некоторых абзацах не соответствуют буквы поясняемых формул.
Наверх
 
 
IP записан
 
Страниц: 1 ... 8 9 10 
Послать Тему Печать