AAW писал(а) 31.05.2018 :: 06:52:12:Меня сильно поразило в этом видео krestik, что в STU нет маркирования и групповой работы с его использованием. У СК давно уже даже зоны имеют индекс группы. Было бы в ST весьма полезно назначать скану какой-то признак, для группировки сканов. Допустим, цветовую категорию, или индекс, чтоб не просто бинарная галка "особо отмеченный скан - да/нет", а посложнее. Мне во время "упражнений" над книжкой Токхейма, на которой я учился многим фишкам СК, подобные метки сильно помогали автоизменения делать. Чтоб без ручного пробега по всем сканам.
Там есть сортировки, которые krestik полностью игнорирует: на этапе Output - по режимам и по наличию отличного от grayscale цвета в исходном скане. Это позволяет сгруппировать страницы и выделять множество, например, страниц с изображениями, при помощи Shift'а. Этого мне хватало. А в версии 0.2.4 я даже подсказки прилепил под страницами при отличной от нормально сортировке, чтобы сразу видеть где какой режим начинается. Можно конечно и группы напридумывать (но не для зон, это точно) - но нужно посмотреть, как это можно сделать удобно с т.з. интерфейса.
А вот чего не хватает (мне) - так это метода, позволяющего в принципе быстро автоматически детектировать страницы с изображениями на них. Потому что вот это первоначальное изменение режима с ч/б на color или mixed приходится делать руками в любом случае (если только у вас не все сканы с изображениями - изначально цветные, а с текстом - изначально grayscale, чем я постоянно пользуюсь еще на этапе сканирования). И тут есть пара вариантов:
1. Честный. Сделать инструмент, который будет долго и нудно пытаться применить ко всем сканам mixed режим и смотреть: найдены ли там какие-то зоны изображений. А в конце работы выделять страницы, на которых хоть одна такая зона нашлась. Это максимально точный (с точностью заложенного Tulon'ом алгоритма) способ, но максимально трудоемкий. Поэтому реализовывать его нужно будет отдельным инструментом, навроде функции Export To.. Но, лучше наверное часик чаю попить, чем час контрол тыкать.
2. Была у меня идея считать "вес" контента на странице. Во всех режимах работы для страниц вычисляется маска (черно белая). Это самая простая операция, которую делает ST на этом этапе и делает он ее всегда. Можно просто посчитать отношения кол-ва черных пикселей к белым. И сделать сортировку по этому коэффициенту. Расчет на то, что страница с текстом и изображением даст больше грязи, чем страница просто с текстом. Конечно, исключения будут. Но и в первом случае возможны сбои (но реже).
Думаю, нужно делать и то и то, но потом.
А еще я думаю, что стоит тоже видео записать и показать свой алгоритм использования STU. Но подходящей книжки для напримера пока под рукой нет - все ч.б. остались.