Преобразует графический файл из нескольких колонок в одну. Удаляет хедеры, футеры, вертикальные линии и пр.
Работает путём вычисления положения объектов на странице, потому что на каждой странице элементы могут быть расположены в разных местах.
Программа разрабатывается и используется для файлов, полученных с поточного сканера - без затемнений и "ползущих" строк, одна страница на файл.
Описание в этом же в архиве.
http://multitran.com/download/splitter.rarИспользуется для предварительной обработки отсканированных словарей. Несколько колонок склеиваются в одну. Тогда всё изображение целиком можно объявить зоной текста в Файнридере. Это позволяет исключить автоопределение областей, в результате которого иногда возникают оторванные блоки.
Программа является частью более сложной технологии по выверке отсканированных словарей. В двух словах, используется робот для извлечения сканов отдельных строк из пакета Файнридера. Текстовые строки и соответствующие им графические сканы преобразуются в специальный формат для дальнейшей проверки текста через веб-интерфейс. Сам Файнридер, как ни странно, для выверки опечаток не очень подходит, так как не позволяет делать автозамену с одновременным просмотром всех заменяемых строк.
В основном это имеет смысл для больших книг, содержащих много опечаток. Кстати, веб-интерфейс позволяет одновременно работать над вычиткой книги множеству людей. Подготовкой книг в нужном формате и всем сопутствующим ПО занимаюсь я один, поэтому всё довольно специфично. Не стояло задачи делать из этого отдельный продукт. Пока выкладываю только разделитель колонок.
Если эта технология кому-то любопытна, можно пообщаться.