OCR форумы Добро пожаловать, Гость. Пожалуйста, выберите Вход или Регистрация
Форум переведен из кодировки UTF-8 в кодировку WINDOWS-1251. По всем вопросам, связанным с кодировкой текста (появлением «кракозябр»), обращайтесь к Администратору.
The forum is translated from the UTF-8 encoding to the WINDOWS-1251 encoding. For all questions related to the encoding of the text (the appearance of 'krakozyabr'), please contact the Administrator.
 
  ГлавнаяСправкаПоискВходРегистрация Администратор Библиотека  
 
Страниц: 1 ... 11 12 13 
Послать Тему Печать
Модификация ScanTailor (Прочитано 23369 раз)
truf
Постоялец
**
Вне Форума



Сообщений: 147
Re: Модификация ScanTailor
Ответ #360 - 27.01.2018 :: 02:06:46
 
Мне попались в лапы чужие сканы в приличном разрешении. Но в книге была только треть страниц в малоцвете, а автор сканов все отсканировал в цвете. А не как я люблю - все в grayscale, кроме страниц, где color действительно нужен.

В итоге на этапе output я не мог автоматически разделить их с помощью сортировки gray sources on top и массово применить смену режима на Mixed. И переключаться между страницами было долго. Поэтому я создал djvu в низком dpi, где все страницы были в color, и вручную просмотрел его, выписывая номера (и диапазоны) страниц, в которых color действительно нужен.

После этого, я прикрутил к ST Universal функцию выделения страниц по их номерам. Скопировал текст с моими записями туда - выбрал все нужные страницы разом, и применил к выбранным смену режима.

Конечно, в теории, я мог бы и не вручную djvu просматривать, а изобрести какой-то счетчик цветов. Но на все случаи жизни сортировок и функций не придумаешь, а в ST все равно не было интерфейса для передачи ему подмножества страниц из внешней программы. Так что, теперь такой интерфейс есть, и это должно быть полезно.

Технически новая команда вызывает окошко, в которое можно скопировать текст с номерами страниц. Нумерация начинается с 1. Нумерация не зависит от текущей сортировки - т.е. страница 1 будет всегда соответствовать первому thumbnail при сортировке normal order. Текст может быть многострочным. ЛЮБЫЕ символы кроме : и - (в окружении пробелов или без) трактуются как разделители номеров. Символы : и - трактуются как диапазон страниц. Это сделано для того, чтобы можно было колонку номеров скопировать, например из Excel, безо всякого форматирования. И вообще копировать списки страниц откуда угодно в любом формате. В окошке также будет динамически писаться сколько номеров страниц ST понимает из вашего текста, так что в real time можно за этим следить.

К этой фиче до кучи сделана функция перехода на страницу по её номеру. Тоже отдельной командой в контекстном меню ленты страниц.


Обе фичи залиты в github и доступны пользователям linux. Бинарники Win пока из-за такой мелочи пересобирать не стал.

Наверх
 
 
IP записан
 
m7876
Постоялец
**
Вне Форума



Сообщений: 66
Re: Модификация ScanTailor
Ответ #361 - 27.01.2018 :: 06:35:33
 
Я в таком случае просто загружаю все в IrfanView и конвертирую. Irfan безумно быстр и может делать кучу всего другого (скажем, добавить правильное разрешение в перефотографированные сканы). В какой-то мере это UNIX-way, где каждая программа делает что-то одно, но хорошо. (Счетчик цветов есть, кстати, в ImageMagick / GraphicsMagick).
Я просто недавно поймал себя на том, что не хочу пользоваться STU и STA. Второй вообще очень непросто собрать (мне так и не удалось), а оба они все больше начинают походить на новогоднюю елку, или на пейзаж слона-живописца из басни Михалкова (настоятельно рекомендую к прочтению).
Меня полностью устраивает обновленный truf STP, к которому я прибил гвоздями единственную фичу -- прямоугольные выделения. В нем и работаю...
Такие дела.
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 3168
Екатеринбург
Пол: male
Re: Модификация ScanTailor
Ответ #362 - 27.01.2018 :: 07:36:05
 
m7876 писал(а) 27.01.2018 :: 06:35:33:
пейзаж слона-живописца из басни

Смех
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
xyz
Активист
***
Вне Форума


Всем привет!

Сообщений: 232
Re: Модификация ScanTailor
Ответ #363 - 27.01.2018 :: 08:38:32
 
Цитата:
пейзаж слона-живописца из басни Михалкова


Категорически не согласен. Я просто не могу нарадоваться как (ну, за исключением пары мелочей) работает STU. Даже написать хвалебный пост об этом чуть раньше хотел Улыбка Отключил не нужный функционал - и работаю как на конвейере. Ничего лишнего, всё по делу. (нестандартные размеры файлов жрёт, кривые png жрёт, джипеговые tiff жрёт, рамки ставит, эпплай кат делает,  "каждую вторую до конца" делает, порядковые номера страниц показывает, исходник по пробелу показывает; диапазон бинаризации расширен - впервые тут порог 50 применял; даже слой грей пару раз использовал; при выключенном сглаживании не слипаются засечки;  не надо ради  отдельных операций держать зоопарк STF+STE...)

STA я тоже пока так и не запускал.

Что касается "мелочей", то самое главное №1, что при обрезании обложек "без полей" он даёт разброс 1-2 пикселя вместо выравнивания под единый размер. Приходится для этой операции обычный СканТейлор держать и использовать.

Остальное скорее баги и фичи, которые обсуждались ранее:

2) для обложек серии НВЖНТ ярко проявилась необходимость отключения выравнивания освещения для инвертированных ч+б сканов;

3) меня невероятно запутывает терминология фореграунд и пикчер лейер. Каждый раз, когда пользую, по сути по новой разбираюсь, как что работает. Для слоя грей вообще хочется рамку, чтобы не сто раз тыкнул (что-то включил. что-то выключил что-то удалил), а обвел рамку и цвета внутри неё по черно-белой маске проявились.
(я и предлагал его назвать как какую-нибудь вариацию от термина "на просвет", а не создавать путаницу с другими программами).

4) Снова проявилась потеря места страницы. Отсортировал по высоте на стадии поля. Если я правлю сами поля, то я могу перейти на следующую, когда страница убежала. Но если я переключался на стадию "полезная область" и двигал там рамку, то при возврате на стадию "поля" я уже нахожусь на новом исправленном месте и перейти на следующую, там, где был при сортировке ранее, не получается.


Никак я табличку не обновлю, что сделано, что нет...


Цитата:
Да вроде нет. 1 бит получается. Может дело не в деварпинге? Какая у вас Tiff компрессия стоит, LZW?
Можете удалить из этого проекта все страницы, кроме одной глючной, затем сохранить его как новый проект и сбросить мне его файл, исходную страницу и страницу-результат?


Извините за задержку, проект за это время успел попасть в корзину.
Я не понял что значит "удалить и сохранить", я просто собрал в папку файл проекта (на 170 страниц), два исходника и результат.   

http://dropmefiles.com/HIxlN

Обратите внимание, там левые половинки результатов  2 бит, а правые 24 бит.

(Однако после того, как запустил сейчас после восстановления удаленных файлов проект по новой, STU считает, что все файлы в нём необработаны и заменяет 24 бит на 2 бит. Но я прекрасно помню, как в списке файлов при просмотре ACDSee среди кучи ч/б страниц, после того как я поправил искажение появилось две псевдо-цветных. Точно! В сохраненном проекте деварпинг отключен. А как только начинаю править искажение - расставляя и тягая красные точки, файлы снова становятся 24 бит.)


А ещё вот страничка из нового проекта, на которой STU  с ошибкой  вываливается:

http://rgho.st/private/8BYVvKhNh/7f2bf71243897c59b1d012026665b676

Update:
И еще один проект в STU крашится, хотя через ST пролезает
http://rgho.st/private/8WzDNyWr4/d0850a3bbac6190cd042dc84e33dbb51
Наверх
« Последняя редакция: 27.01.2018 :: 17:38:37 от xyz »  
 
IP записан
 
xyz
Активист
***
Вне Форума


Всем привет!

Сообщений: 232
Re: Модификация ScanTailor
Ответ #364 - 28.01.2018 :: 00:42:09
 

m7876

Цитата:
оба они все больше начинают походить на новогоднюю елку...
к STP я прибил гвоздями единственную фичу -- прямоугольные выделения. В нем и работаю.



У меня возникла следующая мысль.
Все дополнительные фичи STU можно отключить и работать в максимально простой и удобной лично для каждого версии.

Раз у вас есть ощущение "ёлки" и вы вернулись к STP, то значит просто что-то такое вам не нужное не изымается с панелей. Или, возможно, где-то не работает переключение старый/новый интерфейс,
раз у вас не получилось простой комбинацией галочек заставить  STU выглядеть и работать как STP+прямоугольники.

Какой ненужный функционал болтается ?
Где не хватает переключений интерфейса ?
Наверх
 
 
IP записан
 
truf
Постоялец
**
Вне Форума



Сообщений: 147
Re: Модификация ScanTailor
Ответ #365 - 28.01.2018 :: 17:50:47
 
xyz писал(а) 27.01.2018 :: 08:38:32:
Обратите внимание, там левые половинки результатов  2 бит, а правые 24 бит.


Это эффект из ST FT. Там добавили фичу marginal dewarping. И в рамках нее всем видам dewarping'а сделали еще один deskew на финальной стадии. Т.е. уже после dewarping'а на результат натравливается автоматика, выполняющая deskew (т.к. dewarping может перекосить или подправить ориентацию текста). Автоматика сообщает угол, на который нужно довернуть изображение после dewarp'а, и уровень своей уверенности в этом. Если уровень достаточно высок - deskew применяется.  И вот в этом случае у бинарных изображений сбивается формат на 8bit.
Я исправлю этот эффект путем принудительной конвертации бинарных изображений, подвергшихся последнему deskew, обратно в бинарный формат.

xyz писал(а) 27.01.2018 :: 08:38:32:
А ещё вот страничка из нового проекта, на которой STU  с ошибкой  вываливается:

Update:
И еще один проект в STU крашится, хотя через ST пролезает


Оба падали в моем коде, вырезающим кусок оригинального изображения для отображения по зажатому пробелу. Второй случай выявил проблему со всеми ч.б. изображениями в однобитной кодировке. А первый случай - из-за установленной зоны контента превышающей размер оригинального изображения.
Оба поправил.

Теперь, придется пересобирать Win дистрибутив.
Наверх
 
 
IP записан
 
xyz
Активист
***
Вне Форума


Всем привет!

Сообщений: 232
Re: Модификация ScanTailor
Ответ #366 - 28.01.2018 :: 19:23:10
 
Цитата:
Теперь, придется пересобирать Win дистрибутив.


Если можно, перед сборкой нового вин-дистрибутива поправьте также "гуляние" размеров страниц при выводе "без полей". Оно порождено вашей правкой ошибки вылета при выводе, и в ST не возникает.  (Там, действительно, возможно падение, но происходит оно крайне редко. А вот дельта обложек без полей в STU является правилом.) Мне почему-то кажется, что в STA при импорте фич STU это собирались учесть и  поправить. Но не знаю, сделали ли.

И еще одна раздражающая мелкая мелочь. Писал, кстати, уже про неё. ST сразу раскрывается на весь экран. По окошку же STU при открытии мне для этого приходится делать даже не один, а целых два клика.
Наверх
 
 
IP записан
 
m7876
Постоялец
**
Вне Форума



Сообщений: 66
Re: Модификация ScanTailor
Ответ #367 - 28.01.2018 :: 23:47:46
 
xyz писал(а) 28.01.2018 :: 00:42:09:
m7876
Раз у вас есть ощущение "ёлки" и вы вернулись к STP, то значит просто что-то такое вам не нужное не изымается с панелей. Или, возможно, где-то не работает переключение старый/новый интерфейс,
раз у вас не получилось простой комбинацией галочек заставить  STU выглядеть и работать как STP+прямоугольники.
Какой ненужный функционал болтается ?
Где не хватает переключений интерфейса ? 

Спасибо. Я подумаю. Возможно, это просто свойственные мне одновременно минимализм и консервативность. Но ощущение "слонопейзажа" меня не оставляет.
Наверх
 
 
IP записан
 
xyz
Активист
***
Вне Форума


Всем привет!

Сообщений: 232
Re: Модификация ScanTailor
Ответ #368 - 30.01.2018 :: 11:01:28
 
Запишу тут очередную хотелку на будущее, просто чтобы не забыть:

- сортировки на стадии вывод по типу прижима и по высоте.
(тип цветности часто совпадает коррелирует с оформлением макета/размером страницы)
Наверх
 
 
IP записан
 
truf
Постоялец
**
Вне Форума



Сообщений: 147
Re: Модификация ScanTailor
Ответ #369 - 30.01.2018 :: 23:06:06
 
Я обновил дистрибутивы.
https://github.com/trufanov-nok/scantailor/releases

2 падения - исправлены.
Кол-во цветов в бинарных результатах при dewarp'е исправлено.
+ я улучшил точность наложения оригинального скана при удерживаемом пробеле на этапе output - она сильно люфтила на правых страницах при сильном deskew. (по-дефолту эта фича, вроде, выключена).

Что касается лишних пикселей по краям страниц - изменил логику работы. Теперь STU скорее срежет пару пикселей, чем дорисует.

Ну и go to page num, select pages by their numbers в контекстном меню ленты страниц.
Наверх
 
 
IP записан
 
truf
Постоялец
**
Вне Форума



Сообщений: 147
Re: Модификация ScanTailor
Ответ #370 - 06.02.2018 :: 20:22:58
 
В dev ветку (пока) я добавил изменение в подсветке выбранных страниц в ленте thumbnail. Теперь при выборе нескольких страниц та, что отображается в данный момент, подсвечивается в ленте синим (как раньше), а остальные выбранные страницы - светло-синим. (На самом деле, используются цвета Highlighted из настроек ОС и он же, но на 25% светлее - так что у вас оно может быть и не сине-голубым). Сделано для того, чтобы легче визуально видеть, где именно в ленте страница, над который идет работа. А то при нескольких выбранных страницах оно все сливается.
Скриншот: http://i99.fastpic.ru/big/2018/0206/5e/82802f0c1cda227475e65727ff92b65e.png
Еще добавлены hotkeys (Alt+[Home/End/PgUp/PgDwn) для навигации внутри множества выбранных страниц. Т.е. можно выбрать диапазон страниц, поменять сортировку - страницы разлетятся по ленте, а потом переключатся меду ними с помощь клавиш навигации с зажатым Alt.

Но вообще, хочу поделится ближайшими планами. Хочу переделать диалог Apply To.
Во-первых, их аж 6 разных. Все они содержат список Apply To ( он же Scope) с вариантами "To selected pages", "To All pages", "To following pages" и пр. А некоторые и состоят практически полностью из этого списка. При этом варианты в списках плавают. Где-то что-то есть, где-то чего-то нет. Где-то как-то иначе названо. Я это унифицирую, выделив все в единый компонент, который будет встраиваться в эти диалоги.

Главное - во-вторых. Я хочу избавится от кнопок apply to. На каждом этапе будет только одна такая кнопка. В диалоги будет добавлен динамически создаваемый перечень настроек текущей страницы на данном этапе. И в нем можно будет включать и выключать те настройки, которые ST будет применять к выбранным страницам.
Т.е. пользователь будет выбирать не только на какие страницы скопировать текущие настройки (как сейчас), но и выбирать, какие именно настойки копировать. И все это в одном окне диалога, вызываемым одной кнопкой. Настройки будут отображаться, конечно, только те, которые меняются текущей стадией обработки.

Такой подход позволит достичь максимальной гибкости. Например - поменять всем страницам Margin Bottom не трогая их текущий Top/Left/Right и пр. Также UI будет более консистентным. А главное - можно заменить все ссылки apply to на одну кнопку в одном месте в каждой панели настроек.
Наверх
 
 
IP записан
 
Страниц: 1 ... 11 12 13 
Послать Тему Печать