OCR форумы Добро пожаловать, Гость. Пожалуйста, выберите Вход или Регистрация
Всем привет!
Hi all!
 
  ГлавнаяСправкаПоискВходРегистрация Администратор Библиотека  
 
Страниц: 1 ... 45 46 47 
Послать Тему Печать
Заявки, пожелания на сканирование/оцифровку книг (Прочитано 725358 раз)
bolega
Гуру
****
Вне Форума



Сообщений: 953
Re: Заявки, пожелания на сканирование/оцифровку книг
Ответ #1380 - 27.06.2026 :: 08:19:25
 
AAW писал(а) 27.06.2026 :: 05:00:23:
Выкрутасы с затаскиванием слоя вовнутрь СК сложны и, главное, неочевидны и непрозрачны на этапе парсера.

В СК вообще все сложно, в чем его постоянно и упрекали. Но это все в прошлом. Более СК я не релизю, и никого юзать его не силком не заманиваю. Теперь все новые версии - это исключительно мой личный инструмент. Хейтеры СК могут спать спокойно.

Наверх
 
 
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5958
Екатеринбург
Пол: male
Re: Заявки, пожелания на сканирование/оцифровку книг
Ответ #1381 - 27.06.2026 :: 09:07:04
 
xyz писал(а) 27.06.2026 :: 08:01:12:
И получите обложку другого пиксельного размера.

да. а кому от этого будет плохо? при правильном дпи - никому, ИМХО.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
AlVaKo
Гуру
****
Вне Форума



Сообщений: 712
Алма-Ата
Пол: male
Re: Заявки, пожелания на сканирование/оцифровку книг
Ответ #1382 - 27.06.2026 :: 11:16:16
 
Alex2026 писал(а) 26.06.2026 :: 22:08:03:
Мне надо бы определиться каким софтом я буду пользоваться, в случае если никто не откликнется на мою просьбу и обрабатывать придется самому...

Советчиков понабежало, как в анекдоте про попытку изнасилования на Красной площаде.
Вместо конкретных предложений что делать с колготками, уводят внимание на фасон дамской сумочки. Половина речей про OCR, который к обработке сканов вообще не имеет никакого отношения. OCR это рюшечки для DjVu, которые навешиваются после того как создана е_книга.

@
Alex2026 Посмотрите ЛС.
Наверх
 

Сложно отбинаризировать черную перемычку на белой бумаге, особенно если её там нет.
 
IP записан
 
Alex2026
Новичок
*
Вне Форума


Всем привет!

Сообщений: 13
Re: Заявки, пожелания на сканирование/оцифровку книг
Ответ #1383 - 27.06.2026 :: 11:39:42
 
AAW писал(а) 27.06.2026 :: 05:00:23:
Самый простой путь для примитивных книг, который я знаю, это FineReader 8

Слышал, что FineReader'ом лучше не сканировать и лучше не использовать его, если требуется поворачивать сканы для выравнивания текста - при повороте происходит искажение изображений, строки текста будто ступеньками становятся после поворота.
Наверх
 
 
IP записан
 
Alex2026
Новичок
*
Вне Форума


Всем привет!

Сообщений: 13
Re: Заявки, пожелания на сканирование/оцифровку книг
Ответ #1384 - 27.06.2026 :: 11:42:24
 
xyz писал(а) 27.06.2026 :: 02:26:53:
СканКромсатор

СканКромсатор мне трудно будет освоить - нет локализации, нет практического руководства. Или есть пошаговое руководство для последней версии?

Вообще, я про СканТейлор и СканКромсатор узнал из статьи, где рекомендуют как раз СканТейлор, а не СканКромсатор. "Как сделать электронную копию бумажной книги":
https://lifehacker.ru/kak-sdelat-elektronnuyu-kopiyu-bumazhnoj-knigi/

"Я сталкивался с двумя серьезными программами для обработки отсканированных (сфотографированных) книг: ScanTailor и ScanKromsator.
...
Самые прожженные книгоделы предпочитают ScanKromsator. В нем предельно много настроек и возможностей, но разобраться и понять все предложенные навороты, видимо, не в состоянии и сам автор программы (шутка). Поэтому я рекомендую вам ScanTailor."
...
"Скорее всего, вы не осилили много букв и сразу перешли к выводам. А они для рядового человека неутешительны. Электронное книгоиздание — дело хлопотное, полное трудностей и сюрпризов. Чтобы дослужиться даже до “зеленого пояса”, вам придется потратить кучу времени.
...
Но в целом рекомендую остановиться после обработки в ScanTailor, объединить разрозненные страницы в PDF и дальше не лезть в дебри."
Наверх
 
 
IP записан
 
Alex2026
Новичок
*
Вне Форума


Всем привет!

Сообщений: 13
Re: Заявки, пожелания на сканирование/оцифровку книг
Ответ #1385 - 27.06.2026 :: 11:42:57
 
AlVaKo писал(а) 27.06.2026 :: 11:16:16:
@ Alex2026 Посмотрите ЛС.

Счас посмотрю..
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5958
Екатеринбург
Пол: male
Re: Заявки, пожелания на сканирование/оцифровку книг
Ответ #1386 - 27.06.2026 :: 12:50:39
 
Alex2026 писал(а) 27.06.2026 :: 11:42:24:
предпочитают ScanKromsator. В нем предельно много настроек и возможностей, но разобраться и понять все предложенные навороты, видимо, не в состоянии и сам автор программы

кому когда было НАДО разобраться во всех наворотах СК, тот садился и разбирался. А простенькую чб книжку в нём сделать - нафиг всё-то изучать. Я не менее 5 стартовых текстов только в Хрестоматии видел, сам с десяток раз в видеороликах описывал, и в интернете есть еще штук шесть инструкций. Кабы не десять.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
Lykas
Патриарх
*****
Вне Форума


Всем привет!

Сообщений: 1274
Re: Заявки, пожелания на сканирование/оцифровку книг
Ответ #1387 - 28.06.2026 :: 00:10:48
 
ИМХО каждый варится в своем котелке, вернее как у каждого котелок варит...
Я поначалу вообще страницы обрабатывал в ASD (вроде так называлась).
Обрезать под размер, выделить области картинок, инвертировать выделение, перевести в ч\б.
Потом DjvuSolo сжать или в Djvu Foto, или в Djvu Skan.
Сейчас перешел на связку:
Fast Stone - первоначальная переборка сканов, развороты, перенумерация,
ST - обработка
MS офис пикчер менеджер - уборка фона в картинках
ST Split - деление на слои
Djvu Smail - кодирование ч\б
Djvu Imager - вклейка обложек и иллюстраций
Djvu Pal - раскраска текста

Для журналов типа глянца -
Fast Stone - первоначальная переборка сканов, развороты, перенумерация,
ST - обработка
MS офис пикчер менеджер - уборка фона в картинках
Fast Stone - сжать в PDF и все
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5958
Екатеринбург
Пол: male
Re: Заявки, пожелания на сканирование/оцифровку книг
Ответ #1388 - 28.06.2026 :: 08:44:50
 
есть такая книга: Гробница Тутанхамона, Картера. 1959 год.
Ищу супер
.
...
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
xyz
Патриарх
*****
Вне Форума


Всем привет!

Сообщений: 1006
Re: Заявки, пожелания на сканирование/оцифровку книг
Ответ #1389 - 28.06.2026 :: 09:12:31
 
Цитата:
Вообще, я про СканТейлор и СканКромсатор узнал из статьи, где рекомендуют как раз СканТейлор, а не СканКромсатор. "Как сделать электронную копию бумажной книги":
https://lifehacker.ru/kak-sdelat-elektronnuyu-kopiyu-bumazhnoj-knigi/



Не очень понятно, зачем вы здесь приводите ссылку и цитаты из неё.  Мало ли где какие чудаки чего пишут.
Завершать прочтение её надо после вот этого:

"Со временем многие процессы упрощаются. Если с пяток лет назад этот этап был крайне продолжительным (приходилось пользоваться сканером), то с улучшением камер мобильных телефонов затрачиваемое время существенно сократилось. Конечно, камера камере рознь, но, если подобрать приемлемые условия съемки, должен подойти любой более-менее современный телефон."

Для обработки фоток на телефон СканКромсатор, действительно, не нужен.



Наверх
 
 
IP записан
 
xyz
Патриарх
*****
Вне Форума


Всем привет!

Сообщений: 1006
Re: Заявки, пожелания на сканирование/оцифровку книг
Ответ #1390 - 28.06.2026 :: 09:30:10
 
Я тут случайно наткнулся на книжульку, на примере которой меня убедили, что СТ не годен для бинаризации (2016 год):

https://disk.yandex.ru/i/WVJD2sS5aMMTNw

Тут оригинальный СТ от Тулона. В STU проблема уменьшена (в настройках кнопочку сделали "не сглаживать"), но полностью не решена.
Надо быть слепым, чтобы проблему (напоминаю, ужирнение и избыточное сглаживание) не видеть.

Впрочем, как видим выше, некоторые и фотки на телефон книгами считают.
Говноеды.
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5958
Екатеринбург
Пол: male
Re: Заявки, пожелания на сканирование/оцифровку книг
Ответ #1391 - 28.06.2026 :: 10:12:18
 
xyz писал(а) 28.06.2026 :: 09:30:10:
некоторые

а вы погуглите. ни одного совета, как качественно сделать е-книгу вообще не удастся найти. В теории, грамотно построив запрос, АлисаИИ выдаст красивый компилятивный текст о засечках и полях, четкости картинок и важности сохранения художественного оформления, но при попытках углубления все советы будут исключительно "телефон и скантейлор", даже не фотошоп. Я пробовал.
Впору антипоисковую систему создавать, чтоб мозги не засирать предлагаемыми решениями ничего не понимающего плебса. "Щас мы щелкнем фоточек и автоматом прогоним через чудо-программу".
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
xyz
Патриарх
*****
Вне Форума


Всем привет!

Сообщений: 1006
Re: Заявки, пожелания на сканирование/оцифровку книг
Ответ #1392 - 28.06.2026 :: 10:21:17
 
ИИ учится на текстах. Раз текстов про то, как сделать качественную книгу нет, то ИИ их и не выдаёт.


Примеры ошибок есть ? (вы собирали коллекцию)   НЕТУ, не опубликована.

Я когда-то предлагал придумать систему оценки градаций качества e-книг.
И даже проект предложил. Меня кто-либо поддержал ? - НЕТ.
Бинарная классификация от bolega:   какашка / не-какашка   и всё.
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5958
Екатеринбург
Пол: male
Re: Заявки, пожелания на сканирование/оцифровку книг
Ответ #1393 - 28.06.2026 :: 10:26:04
 
xyz писал(а) 28.06.2026 :: 10:21:17:
вы собирали коллекцию

и продолжаю собирать. Такие перлы попадаются до сих пор Улыбка

xyz писал(а) 28.06.2026 :: 10:21:17:
НЕТУ, не опубликована

куда публиковать-то. Формально ведь предложения разбросаны внутри всевозможных форумов, пдфок, chm-ок, видеозаписей. Но они не всплывают.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5958
Екатеринбург
Пол: male
Re: Заявки, пожелания на сканирование/оцифровку книг
Ответ #1394 - 28.06.2026 :: 14:51:45
 
xyz писал(а) 28.06.2026 :: 09:30:10:
Я тут случайно наткнулся на книжульку, на примере которой меня убедили, что СТ не годен для бинаризации (2016 год)

свежачок, но то же самое
https://disk.yandex.ru/d/MK91Gc-NLrVurg Кочкаров Ж. А. Неорганическая химия в уравнениях реакций. 2017. 412 с. от maksymus
на руборде в ветке физ-хим-матем книг опубликовали инфу что залили в либген. Решил глянуть,
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5958
Екатеринбург
Пол: male
Re: Заявки, пожелания на сканирование/оцифровку книг
Ответ #1395 - 28.06.2026 :: 16:34:21
 
AAW писал(а) 28.06.2026 :: 10:26:04:
куда публиковать-то.

хм. думал о запуске своего сайта. А Вадима можно попросить создать раздел в библиотеке не в виде файлов, а в виде html-ок? Типа набор страничек с советами и картинками по книгообработке.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
xyz
Патриарх
*****
Вне Форума


Всем привет!

Сообщений: 1006
Re: Заявки, пожелания на сканирование/оцифровку книг
Ответ #1396 - 28.06.2026 :: 17:33:50
 
Цитата:
В теории, грамотно построив запрос, АлисаИИ выдаст ... Я пробовал.


Алиса тут втягивает в рот жидкое.

Я вот перплексити напряг, аллергии результат у меня не вызывает:

https://disk.yandex.ru/i/7HWNBT7zd_Z56g

Наверх
 
 
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5958
Екатеринбург
Пол: male
Re: Заявки, пожелания на сканирование/оцифровку книг
Ответ #1397 - 28.06.2026 :: 17:59:40
 
xyz писал(а) 28.06.2026 :: 17:33:50:
аллергии результат у меня не вызывает

ну, не так плохо как могло быть.
Есть принципиальные косяки, и очень уж занудно-избыточно местами.
Косяки: ни слова про CLA (цветной текст и тем более малоцветка), и карты в 300дпи всегда станут нечитаемыми после сжатия. Я специально на картах из пятитомника Спицына тренировался, как только ни изгалялся, результат неудовлетворителен.
Ну и ни слова про чистку такого:
https://disk.yandex.ru/i/8rtd7JDwbL862g
не нашел сервиса для показа картинки превьюшкой
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
xyz
Патриарх
*****
Вне Форума


Всем привет!

Сообщений: 1006
Re: Заявки, пожелания на сканирование/оцифровку книг
Ответ #1398 - 28.06.2026 :: 18:45:46
 
100% вранья я там не вижу. Неточности и умолчания.

Например: "Слишком агрессивный деспекл в СТ - типичная ошибка". С одной стороны, правильно. С другой - там любой будет слишком сильным (ибо непредсказуемый). В СТ деспекл выключать надо, даже если ч.б там делается.

"Такое" только глифами исправлять, про это нигде не написано.

Малоцветку для новичка лучше как полноцвет 600 дпи делать.

Интересно также, кто и где опубликовал тексты, нахваливающие STA ? Так что он именно его прямо так смело рекомендует.
Наверх
 
 
IP записан
 
Lykas
Патриарх
*****
Вне Форума


Всем привет!

Сообщений: 1274
Re: Заявки, пожелания на сканирование/оцифровку книг
Ответ #1399 - 28.06.2026 :: 19:25:37
 
AAW писал(а) 28.06.2026 :: 17:59:40:
ну, не так плохо как могло быть.
Есть принципиальные косяки, и очень уж занудно-избыточно местами.
Косяки: ни слова про CLA (цветной текст и тем более малоцветка), и карты в 300дпи всегда станут нечитаемыми после сжатия. Я специально на картах из пятитомника Спицына тренировался, как только ни изгалялся, результат неудовлетворителен.
Ну и ни слова про чистку такого:
https://disk.yandex.ru/i/8rtd7JDwbL862g
не нашел сервиса для показа картинки превьюшкой

Ручками чистить...
https://disk.yandex.ru/d/dEiih709GGZ5lQ
Первый автомат, второй ручками в ST - минут пять с кофе.
Потом огрехи доделать в FS - клонирование - еще пару минут.
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5958
Екатеринбург
Пол: male
Re: Заявки, пожелания на сканирование/оцифровку книг
Ответ #1400 - 28.06.2026 :: 19:45:46
 
xyz писал(а) 28.06.2026 :: 18:45:46:
100% вранья я там не вижу. Неточности и умолчания.

ну пусть кто-нибудь попробует следовать этому описанию... Сомневаюсь в успехе.
Кстати, я глянул описание, что такое перплексити, она должна была ссылки на источники выдать.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
xyz
Патриарх
*****
Вне Форума


Всем привет!

Сообщений: 1006
Re: Заявки, пожелания на сканирование/оцифровку книг
Ответ #1401 - 28.06.2026 :: 19:49:07
 
Я попросил в ворд выгрузить, а запрос не сохранил. Утрачены.
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5958
Екатеринбург
Пол: male
Re: Заявки, пожелания на сканирование/оцифровку книг
Ответ #1402 - 28.06.2026 :: 20:02:19
 
Lykas писал(а) 28.06.2026 :: 19:25:37:
Ручками чистить...

да это-то понятно. упоминаний о таких проблемах нет. Типа источник всегда распрекрасный.
Да. Забыл: про растр толком ничего. И "фото"/"иллюстрации" тоже бывают си-ильно разного исполнения. Да и штриховые материалы не всегда в 600дпи уложишь.
Парность полей не упомянута. Центровка разворотов. Да еще много чего. Один "рус/eng" позабавил - какой-нибудь филологический или сравнительно-языкознанческий текст, и всё. Возникающие там проблемки от глифирования до ocr-слоя вроде только niccolo упоминал.

--
Эхх, старались студенты Улыбка
Пара примеров оттуда же
https://disk.yandex.ru/d/vFIyPDVNXNFZKQ
Давненько мне такие экземпляры не попадались. Сижу полдня уже над ним, минута страница.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
Dmitry7
Модератор
*****
Вне Форума


Соберем Серии "НВЖНиТ"!

Сообщений: 6102
Санкт-Петербург
Пол: male
Re: Заявки, пожелания на сканирование/оцифровку книг
Ответ #1403 - 28.06.2026 :: 22:12:33
 
xyz писал(а) 28.06.2026 :: 17:33:50:
перплексити напряг, аллергии результат у меня не вызывает:

юзал перплексити, в общем она неплоха (для научных вопросов по крайней мере)
Наверх
 

"Если хочешь сделать что-то хорошо, сделай это сам!"
332371574  
IP записан
 
Страниц: 1 ... 45 46 47 
Послать Тему Печать