OCR форумы Добро пожаловать, Гость. Пожалуйста, выберите Вход или Регистрация
Всем привет!
Hi all!
 
  ГлавнаяСправкаПоискВходРегистрация Администратор Библиотека  
 
Переключение на Главную Страницу Страниц: 1
Послать Тему Печать
Распознать книгу (Прочитано 1598 раз)
Владимир Никонов
Новичок
*
Вне Форума


Всем привет!

Сообщений: 0
Распознать книгу
17.12.2022 :: 00:01:20
 
Есть сканы книги: https://cloud.mail.ru/public/WuQW/TE5Hx5hmA

Нужно распознать и на выходе получить текст в формате .doc Есть ли специалисты на форуме, кто этим целенаправленно занимается? Работу оплачу.
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5471
Екатеринбург
Пол: male
Re: Распознать книгу
Ответ #1 - 17.12.2022 :: 10:54:28
 
распознать-то несложно:
https://disk.yandex.ru/d/_ACM2yxBdp9Dkg
что вы с этим делать станете, с распознаванием таким, вот вопрос.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
Владимир Никонов
Новичок
*
Вне Форума


Всем привет!

Сообщений: 0
Re: Распознать книгу
Ответ #2 - 17.12.2022 :: 13:45:20
 
Распознать и сам могу. Мне нужно вычитать и привести в идеальный вид.
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5471
Екатеринбург
Пол: male
Re: Распознать книгу
Ответ #3 - 17.12.2022 :: 13:55:09
 
а! оригинал-макет. Ну, тысяч семьдесят заплатите? Я в прошлом году слышал, за сложный макет больше 150-ти взяли. Этот попроще.

Улыбка
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
Владимир Никонов
Новичок
*
Вне Форума


Всем привет!

Сообщений: 0
Re: Распознать книгу
Ответ #4 - 17.12.2022 :: 17:02:26
 
Мне фрилансеры вкатили 35000, а делал-то в районе 8000.
Наверх
 
 
IP записан
 
slava_kry
Гуру
****
Вне Форума



Сообщений: 552
Re: Распознать книгу
Ответ #5 - 17.12.2022 :: 19:54:34
 
@
Владимир Никонов
Ужас Аднака  Класс Смех
Ну и сделайте за 8 тыщ - кто вам мешает. Улыбка
Я тоже хочу DSP-процессор не за 150 тыщ, а всего за 10-ку максимум. Улыбка

А если серьёзно, то корректора нормального сначала нужно найти. Только ему вы отдадите 5-10 тыщ за 3 полных прочитки.
Вам дорога в типографию. А с корректорами там сейчас у всех очень туго.
Наверх
 

Он сказал им: вы выказываете себя праведниками пред людьми, но Бог знает сердца ваши, ибо что высоко у людей, то мерзость пред Богом.
 
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5471
Екатеринбург
Пол: male
Re: Распознать книгу
Ответ #6 - 17.12.2022 :: 22:05:55
 
Владимир Никонов писал(а) 17.12.2022 :: 17:02:26:
делал-то в районе 8000

ну да, и вы конечно же найдёте в интернете кретинов, готовых сделать подешевле но покачественнее.

Гордыня, она такая, да.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
Lykas
Патриарх
*****
Вне Форума


Всем привет!

Сообщений: 1084
Re: Распознать книгу
Ответ #7 - 17.12.2022 :: 23:07:53
 
AAW писал(а) 17.12.2022 :: 22:05:55:
ну да, и вы конечно же найдёте в интернете кретинов, готовых сделать подешевле но покачественнее.
Гордыня, она такая, да.

Быстро, дешево и без проблем вас надует МММ...
А если серьезно, то вычитка текстов это такое занятие... На очень любителя или за нормальные деньги. Году этак в 2005 вычитал несколько книжек, с тех пор завязал с этим делом. Времязатраты закритические.
Наверх
 
 
IP записан
 
xyz
Гуру
****
Вне Форума


Всем привет!

Сообщений: 875
Re: Распознать книгу
Ответ #8 - 18.12.2022 :: 04:41:43
 
У сгибов блёкло отсканировано, и мусора в виде спеклов многовато, вот OCR и плохой.
Тут надо сначала с глифами непропечатанные участки повосстанавливать и крупные спеклы убрать.
Потом, возможно, автоглифы последнего СК применить, по сути это визуальная поддержка вычитки.

Трудозатраты будут - условно, месяц вечеров.


Надо было при сканировании не жалеть сильно разгибать книжку, или раздобыть лишний экземпляр, который был бы сканированием испорчен. (отрыв переплета и полноценное разгибание разворотов. возможно, постраничное сканирование.)  Благо книжка продается. Чем на каждой второй странице буквы у сгиба перенабирать.
Представлены по сути черно-белые сканы. Надо было сканировать в цвете, это также расширяет возможности спасения букв у сгиба.

ИМХО, надо пересканировать.
чтобы вот такого вот на каждой второй странице не было:
...

Перегнал в джву:
https://dropmefiles.com/Y9nRu
Наверх
 
 
IP записан
 
Владимир Никонов
Новичок
*
Вне Форума


Всем привет!

Сообщений: 0
Re: Распознать книгу
Ответ #9 - 18.12.2022 :: 22:31:25
 
Классно получилось в djvu у вас перевести. При таком качестве и распознавать не нужно! Спасибо!
Наверх
 
 
IP записан
 
Lykas
Патриарх
*****
Вне Форума


Всем привет!

Сообщений: 1084
Re: Распознать книгу
Ответ #10 - 18.12.2022 :: 23:57:58
 
xyz писал(а) 18.12.2022 :: 04:41:43:
У сгибов блёкло отсканировано, и мусора в виде спеклов многовато, вот OCR и плохой.

Надо было при сканировании не жалеть сильно разгибать книжку, или раздобыть лишний экземпляр, который был бы сканированием испорчен. (отрыв переплета и полноценное разгибание разворотов. возможно, постраничное сканирование.)  Благо книжка продается. Чем на каждой второй странице буквы у сгиба перенабирать.

ИМХО, надо пересканировать.
чтобы вот такого вот на каждой второй странице не было:
https://i.imgur.com/jvyyHi0.png

ИМХО из-за того что-бы этого не было, взял оптибук.
Наверх
 
 
IP записан
 
Владимир Никонов
Новичок
*
Вне Форума


Всем привет!

Сообщений: 0
Re: Распознать книгу
Ответ #11 - 19.12.2022 :: 13:13:19
 
А что такое оптибук?
Наверх
 
 
IP записан
 
Владимир Никонов
Новичок
*
Вне Форума


Всем привет!

Сообщений: 0
Re: Распознать книгу
Ответ #12 - 19.12.2022 :: 13:22:35
 
xyz писал(а) 18.12.2022 :: 04:41:43:
У сгибов блёкло отсканировано, и мусора в виде спеклов многовато, вот OCR и плохой.
Тут надо сначала с глифами непропечатанные участки повосстанавливать и крупные спеклы убрать.


Какие нужно настройки на будущее поставить сканеру для лучшего сканирования? 600 dpi, черно-белый? Программа Vuescan.
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5471
Екатеринбург
Пол: male
Re: Распознать книгу
Ответ #13 - 19.12.2022 :: 13:56:53
 
вам сканер следует поменять на CCD.

UPD
примерно вот так, хотя бы:
https://disk.yandex.ru/i/PApfiGchJFnZqA
Наверх
« Последняя редакция: 19.12.2022 :: 15:24:40 от AAW »  

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
xyz
Гуру
****
Вне Форума


Всем привет!

Сообщений: 875
Re: Распознать книгу
Ответ #14 - 19.12.2022 :: 19:53:56
 
На CIS сканере книжку можно распотрошить постранично, и каждую крышкой плотно прижимать.

OpticBook:

...
Наверх
 
 
IP записан
 
Владимир Никонов
Новичок
*
Вне Форума


Всем привет!

Сообщений: 0
Re: Распознать книгу
Ответ #15 - 19.12.2022 :: 21:56:04
 
О, круто! А какую модель порекомендуете?
Наверх
 
 
IP записан
 
Переключение на Главную Страницу Страниц: 1
Послать Тему Печать