Здравствуйте,
kamenkapenza!
Вы сетуете на отсутствие подробного видео по обработке книг в ScanKromsator’e.
Чтобы хорошо изучить порядок работы в ScanKromsator’e нужно читать документацию, в видеороликах не получится изложить все тонкости и особенности работы в SK.
Есть очень хорошая компиляция материалов по работе в SK, так называемая Хрестоматия по СК версии 2.1, скачать можете здесь:
https://yadi.sk/d/NrtuRm3cxbarIwили
https://cloud.mail.ru/public/5J24/4c49mjf1jЕсли файл формата chm на вашем компьютере не откроется (в современных версиях Windows бывает необходимо предварительно этот файл разблокировать), то для его просмотра можно воспользоваться бесплатной программой Sumatra PDF.
Хрестоматия содержит много скриншотов, наглядно разъясняющих все этапы работы в SK.
Теперь о выравнивании страниц по ширине, как вы выражаетесь. В ScanKromsator’e оно есть, просто не так наглядно реализовано, как в ScanTailor’e.
Я не великий специалист по ScanKromsator’у, я только учусь, но рискну поделиться с вами своими знаниями.
Первый этап работы в ScanKromsator’e после загрузки файлов изображений – черновая расстановка резаков, которую программа делает автоматически. Положение резаков нужно проверить, чтобы не был отрезаны, например, номера страниц.
Аналогичную операцию необходимо выполнять и в ScanTailor’e, она выполняется в разделе программы «Полезная область».
Отличие между SК и ST в том, что в ST сразу необходимо очень точно установить границу полезной области (текстового блока или изображений), если программа этого сама не сделала из-за обилия помарок на полях, например; а в СК – нет, достаточно примерно установить резаки, не придвигая их вплотную к контуру текстового блока (хотя бывают и исключения).
ScanTailor после установки границ полезной области этим и ограничивается, далее ST обрезает страницы по границе установленной полезной области, добавляя заданные поля в ходе финальной обработки страниц (приведения к чёрно-белому виду, увеличения разрешения страниц, удаления мусора на страницах и т.д.).
В ScanKromsator’е существует двухэтапная обработка сканов
На первом этапе ScanKromsator в процессе обработки страниц (поворота и обрезки страниц, бинаризации, увеличения dpi, применения фильтров, и т.п.) запускает алгоритм выявления контуров текста на страницах внутри областей, ограниченных резаками, обрезает страницы по выявленным контурам, но при записи выходных файлов на диск пока не добавляет поля к обработанным страницам и не устанавливает одинаковые размеры страниц.
После обработки страниц программа рассчитывает размер книги и применяет заданные ранее размеры полей (их можно назначить в пикселях или в миллиметрах) и открывает окно просмотра результата (Result View), в котором показаны контуры текстовых блоков на страницах одного размера, с установленными размерами полей. Но, как я писал выше, этих полей и одинаковых размеров страниц пока нет в записанных на диск выходных файлах.
Положение границ контуров текстовых блоков можно менять точно так же как в ScanTailor’e; можно также изменять выравнивание блоков текста (например, по верхнему или по нижнему краю страницы) аналогично возможностям ScanTailor’а. Можно автоматически рассчитать новый размер книги, изменить размеры полей. Все изменения сразу будут видны в окне Result View. А в ScanTailor’е, например, если после финальной обработки сканов (операция "Вывод" в программе) задать новые размеры полей, то придётся повторно обрабатывать все файлы.
На втором этапе, когда все страницы просмотрены, контуры текстовых блоков, размеры страниц, величина полей определены, нужно выполнить так называемую финализацию, при этом выполняется окончательное добавление полей и унификация размеров всех страниц книги с записью файлов на диск.
Ниже примеры:
Автоматически расстановленные в SK резаки:
Обработанные страницы с установленными программой контурами текстовых блоков:
Далее на левой странице я исправил положение левой границы контура, придвинул её к тексту, отсёк мусор. Мусор потом нужно будет удалять вручную, изменение границы контура влияет только на положение содержимого контура на странице в зависимости от того, каким оно задано (выравнивание по центру, по левому краю и т.д.):
В данном случае до начала обработки положение резаков можно вручную скорректировать, сразу отсекая мусор:
Тогда положение границы контура текстового блока можно не менять (и мусор не попал внутрь текстового блока):
Если на страницах книги нет крупного мусора, ScanKromsator очень точно определяет контуры текстовых блоков, в отличие от ScanTailor’а, который какую-нибудь крупную точку на полях страницы практически всегда воспринимает как часть текста.
После проверки всех страниц нужно выполнить финализацию, в результате получаем одинаковые размеры страниц всей книги:
И ещё добавлю – в ScanKromsator’e процесс очистки страниц от мусора реализован на порядок лучше, чем в ScanTailor’e.
В ScanKromsator’e есть инструмент «ластик», причем разных цветов: и чёрного, и белого, и т.н. магического цвета; есть возможность удалить ненужный элемент на странице («галочку», пятно, подчеркивание, не задевающее буквы и т.п.) одним кликом мышки (комбинация Ctrl + Shift + клик левой кнопкой мышки), также есть возможность нажатием одной кнопки или кликом мышки по пиктограмме удалить на странице весь мусор («спеклы» в терминах SK), размер которого меньше заданного в пикселях размера. Например, при разрешении выходных файлов 600 dpi, размер точек в предложениях обычно бывает больше 10 пикселей, то есть я могу задать размер удаляемого мусора на странице 10 пикселей, и автоматически почистить страницы от мелкого мусора, не опасаясь, что будут удалены элементы текста. Есть возможность достаточно ярко подсветить спеклы менее заданного в настройках размера для выборочного удаления мусора внутри блоков текста.
В общем,
kamenkapenza, советую вам присмотреться к программе ScanKromsator. Читайте документацию, не дожидаясь появления устраивающих вас видеороликов, задавайте вопросы на форумах.
В конце концов вы же и скачиваете книги гигабайтами, и обрабатываете сканы книг, делаете их электронные версии, и, я уверен, читаете книги. Вы же читатель! Так читайте документацию!
А потом и свои видеоуроки по ScanKromsator’у запишете
Цитата:в прямом эфире, без пауз