OCR форумы Добро пожаловать, Гость. Пожалуйста, выберите Вход или Регистрация
Всем привет!
Hi all!
 
  ГлавнаяСправкаПоискВходРегистрация Администратор Библиотека  
 
Переключение на Главную Страницу Страниц: 1
Послать Тему Печать
Переделка плохих книг (Прочитано 11201 раз)
Djvuser
Новичок
*
Вне Форума


Всем привет!

Сообщений: 8
Переделка плохих книг
28.11.2016 :: 18:53:21
 
Добрый день. Есть две редкие книги по интерлингвистике в PDF, цветные развороты, да ещё и с низим контрастом, видимо.

Я пытался разобрать файлы Finereader'ом и обработать ScanTailor'ом, но результат получается трудно читаемым.

Возможно ли переделать книги в божеский вид?

Ссылки:

1. 79 Mb https://goo.gl/S5XYsa
2. 36 Mb https://goo.gl/Q1hGVY
Наверх
 
 
IP записан
 
joker2156
Активист
***
Вне Форума



Сообщений: 279
Re: Переделка плохих книг
Ответ #1 - 29.11.2016 :: 07:35:04
 
Если цель улучшить читаемость - посмотрю ближе завтра-послезавтра, на первый взгляд в Bibliografio будет много потерь, потому как разрешение маленькое и во многих местах части букв угадываются нежели на самом деле видны.
Наверх
 
 
IP записан
 
xyz
Гуру
****
Вне Форума


Всем привет!

Сообщений: 855
Re: Переделка плохих книг
Ответ #2 - 29.11.2016 :: 08:10:36
 
Для того, что с сайта архив.орг,
можно скачать исходные raw фотосканы в jp2
и сделать нормально.

Например, вторая книга точно оттуда:
https://archive.org/download/histoiredelalang00coutuoft


Наверх
 
 
IP записан
 
Djvuser
Новичок
*
Вне Форума


Всем привет!

Сообщений: 8
Re: Переделка плохих книг
Ответ #3 - 29.11.2016 :: 09:59:49
 
1. Спасибо. У меня с Biblliografio так и получилось. Если жирность повышать, то плывут титулы на полях, которые большим шрифтом.

После этого я пробовал с помощью пакетной обработки поднять насыщенность, резскость и контрастность в tiff-ах, которые получились после разборки pdf. Потом опять SkanTailor-ом. Эффект вроде бы есть, но незначительный. Я не специалист в обработке изображений, но возможно здесь какой-то механизм сглаживания нужен.

Если ничего сделать нельзя будет придётся просить владельца книги ещё раз пересканировать. Проблема в том, он в бельгийский пенсионер  Улыбка

2. Да, книгу брал c archive.org. Не обратил внимание, что есть архив сканов. Сегодня скачаю, попробую обработать.
Наверх
 
 
IP записан
 
xyz
Гуру
****
Вне Форума


Всем привет!

Сообщений: 855
Re: Переделка плохих книг
Ответ #4 - 29.11.2016 :: 10:16:13
 
Цитата:
Если ничего сделать нельзя будет придётся просить владельца книги ещё раз пересканировать. Проблема в том, он в бельгийский пенсионер


Если он сканировал ФР, то возможно там пакет остался.
У ФР так бывает. Экспортировать как пдф - и все пакуется, а исходные тифаки лежат в пакете.

PS
Хотя, впрочем, в свойствах файла программой-креатором указан ScanSoft OmniPage 16...

У первой пдфки разрешение 100 дпи. Это только в мусор. Из неё ничего не сделать, если исходников нет.
Сканить надо на 600, там мелкий шрифт в примечаниях.
Наверх
 
 
IP записан
 
Djvuser
Новичок
*
Вне Форума


Всем привет!

Сообщений: 8
Re: Переделка плохих книг
Ответ #5 - 29.11.2016 :: 18:49:32
 
Да 100 dpi это  Плачущий C Bibliografio всё ясно. Пересканировать.

Скачал архив сканов Historio. Файлы в формате jp2 но FastStone их не распознаёт. Переименовал их в jpg стали открывться, но очень медленно. И самое главное, не открываются ScanTailor-ом. Говорит не поддерживаемый формат.

Пример оригинального скана: https://goo.gl/VVBiJ7
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
На Форуме


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5429
Екатеринбург
Пол: male
Re: Переделка плохих книг
Ответ #6 - 29.11.2016 :: 19:28:18
 
Djvuser писал(а) 29.11.2016 :: 18:49:32:
Файлы в формате jp2 но FastStone их не распознаёт

irfanview 4.20 открыл. пакетно перекодируйте в обычный джипег.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
Djvuser
Новичок
*
Вне Форума


Всем привет!

Сообщений: 8
Re: Переделка плохих книг
Ответ #7 - 30.11.2016 :: 15:56:11
 
FastStone открывает после переименования jp2 в jpg, а вот SkanTailor нет.
Наверх
 
 
IP записан
 
xyz
Гуру
****
Вне Форума


Всем привет!

Сообщений: 855
Re: Переделка плохих книг
Ответ #8 - 30.11.2016 :: 16:32:00
 
СканТэйлор формат jp2 не понимает.
Читайте к нему справку. (странное обсуждение.)

Перекодируйте в тиффы с помощью IrfanView.
Наверх
 
 
IP записан
 
balik2
Активист
***
Вне Форума


Всем привет!

Сообщений: 226
Пол: male
Re: Переделка плохих книг
Ответ #9 - 30.11.2016 :: 16:48:02
 
jp2  можно обрабатывать сразу в сканкромсаторе, некоторые книги с архив.орг обрабатывал, результат был норм
Наверх
 
 
IP записан
 
joker2156
Активист
***
Вне Форума



Сообщений: 279
Re: Переделка плохих книг
Ответ #10 - 01.12.2016 :: 06:38:45
 
15 страниц из Библиографии:

русфолдер
Наверх
 
 
IP записан
 
Djvuser
Новичок
*
Вне Форума


Всем привет!

Сообщений: 8
Re: Переделка плохих книг
Ответ #11 - 01.12.2016 :: 09:29:34
 
joker2156 писал(а) 01.12.2016 :: 06:38:45:
15 страниц из Библиографии:

русфолдер


Отлично! Даже больше чем я ожидал. Текст в целом читаем, хотя и пробелы есть. Вы чем обрабатывали сканы? Была ли предварительная обработка изображений (поднять контраст,насыщенность)?

Historie перекодировал в tiff, загрузил в SkanTailor. Там другая проблема: Страница занимает около 50% от площади изображения. Книга, видимо, копировалась с помощью фото-сканера. Но не это главное. Сама книга лижит на какой-то сетчатой ткани, которая сбивает с толку программу при определении полезной области. В результате все левые страницы выставляют полезной площадью всю картинку. Т.е. у половины страниц надо границы области выставлять вручную, а это больше 300 шт.

Пример страницы с сеткой https://goo.gl/2aC4gt
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
На Форуме


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5429
Екатеринбург
Пол: male
Re: Переделка плохих книг
Ответ #12 - 01.12.2016 :: 09:57:20
 
Djvuser писал(а) 01.12.2016 :: 09:29:34:
Т.е. у половины страниц надо границы области выставлять вручную

до загрузки в ST обрежьте холст пакетно, графредактором.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
Djvuser
Новичок
*
Вне Форума


Всем привет!

Сообщений: 8
Re: Переделка плохих книг
Ответ #13 - 01.12.2016 :: 16:07:36
 
AAW писал(а) 01.12.2016 :: 09:57:20:
до загрузки в ST обрежьте холст пакетно, графредактором.

Спасибо, всё получилось. Теперь вот какая проблема. Чётные и нечётные страницы отличаются по жирности при выводе.

Пример: https://goo.gl/vibj2Q
Исходники этих страниц: https://goo.gl/ATr9lL

Я хотел уменьшить жирность для нечётных страниц в SkanTailor, но там нет такой опции. Можно для всех, для следующих и только для этой.

Можно ли что-то сделать?
Наверх
 
 
IP записан
 
xyz
Гуру
****
Вне Форума


Всем привет!

Сообщений: 855
Re: Переделка плохих книг
Ответ #14 - 01.12.2016 :: 19:22:34
 
Цитата:
Чётные и нечётные страницы отличаются по жирности при выводе.

Ну так сделайте отдельно четные, потом отдельно нечетные, не особо выравнивая поля,
а потом запихните их снова уже вместе в СТ.
Наверх
 
 
IP записан
 
joker2156
Активист
***
Вне Форума



Сообщений: 279
Re: Переделка плохих книг
Ответ #15 - 02.12.2016 :: 04:12:52
 
Djvuser писал(а) 01.12.2016 :: 09:29:34:
Вы чем обрабатывали сканы? Была ли предварительная обработка изображений (поднять контраст,насыщенность)?
Все делалось экшном в фотошопе, кроме страницы с портретом. В ближайшие дни заниматься не будет возможности, потом сообщите, есть ли возможность найти получше качество или нужно делать что есть.
Наверх
 
 
IP записан
 
Djvuser
Новичок
*
Вне Форума


Всем привет!

Сообщений: 8
Re: Переделка плохих книг
Ответ #16 - 02.12.2016 :: 15:20:16
 
xyz писал(а) 01.12.2016 :: 19:22:34:
Ну так сделайте отдельно четные, потом отдельно нечетные, не особо выравнивая поля, а потом запихните их снова уже вместе в СТ.

Проблема как раз с полями. Я три часа расставлял поля на 700 стр. Не хочется всю работу переделывать заново.
joker2156 писал(а) 02.12.2016 :: 04:12:52:
Все делалось экшном в фотошопе, кроме страницы с портретом. В ближайшие дни заниматься не будет возможности, потом сообщите, есть ли возможность найти получше качество или нужно делать что есть.

Я уже запросил пересканирование. Товарищ сопротивляется  Улыбка Сказал, что наверное это возможно, но он не умеет сканировать никак иначе, кроме как предустановленным форматом PDF и он не знает когда у него найдётся время.
Наверх
 
 
IP записан
 
xyz
Гуру
****
Вне Форума


Всем привет!

Сообщений: 855
Re: Переделка плохих книг
Ответ #17 - 02.12.2016 :: 15:48:25
 
Там есть ещё режим "применить к выбранным".
Тогда кликните 350 страниц. Всё меньше чем 3 часа.
Наверх
 
 
IP записан
 
xyz
Гуру
****
Вне Форума


Всем привет!

Сообщений: 855
Re: Переделка плохих книг
Ответ #18 - 02.12.2016 :: 20:42:37
 
Цитата:
Я уже запросил пересканирование. Товарищ сопротивляется 


Omni  - это замороченная дрянь, у меня на работе как-то стояла.  Советую вам самим написать ему инструкцию, как там правильно параметры выставить

http://download.support.xerox.com/pub/docs/FFSCANPCDESKTOP/userdocs/any-os/en/Om...
Наверх
 
 
IP записан
 
Переключение на Главную Страницу Страниц: 1
Послать Тему Печать