OCR форумы Добро пожаловать, Гость. Пожалуйста, выберите Вход или Регистрация
Всем привет!
Hi all!
 
  ГлавнаяСправкаПоискВходРегистрация Администратор Библиотека  
 
Страниц: 1 2 3 4 ... 18
Послать Тему Печать
Модификация ScanTailor (Прочитано 301812 раз)
truf
Активист
***
Вне Форума



Сообщений: 254
Re: Модификация ScanTailor
Ответ #30 - 14.09.2017 :: 03:02:34
 
@
m7876

По поводу вашего фидбека:
1) Считаем за баг и исправляем.
2) Выясню как оно работает, возможно отключим или переделаем.
3)m7876 писал(а) 14.09.2017 :: 00:22:27:
(chem otlichajutsja -- ne ochenj jasno)
- один просто рамку описывает вокруг картинки, т.е. берет максимальные координаты точек картинки. А второй каким-то хитрым способом способен детектировать и отсекать явный мусор на краях картинки и сделать рамку поплотнее. Возможно, просто вписывает прямоугольник максимальной площади. Точно не разглядывал, но они отличались.
Про различие с Plus - будем считать багом и проверим. Возможно от вас потребуется скан, на котором баг явно виден. Посмотрим.
4) Сделаем.
5-6) Частично уже есть, остальное будем доделывать постепенно.

Наверх
 
 
IP записан
 
truf
Активист
***
Вне Форума



Сообщений: 254
Re: Модификация ScanTailor
Ответ #31 - 14.09.2017 :: 03:03:02
 
Я посмотрел в Plus (создал у себя ветку plus-upd с патчами, необходимыми, чтобы без проблем собирать его с современными boost/компилятором). Там в общем-то не так уж и много новшеств:

Цитата:
Choice of the compression method for bitonal images -  для всех страниц разом, bitonal и только между CCITT Group 4 Fax / LZW
Add settings for default Output despeckling - cautious/normal/aggressive (на самом деле в ST это 3 разных размера NxN пикселей, и неплохо бы позволять их настраивать, а не только переключаться между ними)
Add settings for default Output threshold level
Autosave controlls - make save and restore state - со сложной логикой
toggle normalize illuminations in Merge Output Mode


Всё вокруг настроек крутится. Просто брать код из этой ветки я не хочу, потому что: во-первых, аналог toggle normalize illuminations у меня есть в собственной реализации, а остальное - не горит. Во-вторых, автор при реализации настроек отклоняется от первоисточника, а у меня и свое видение на этот счет и придется ломать уже его архитектуру и гнуть в другую сторону.

Поэтому,
1. Формально сливаться с plus мы не будем. Его функционал будем считать хотелками. Может кое-какой код я оттуда и подгляжу. Особенно сложной выглядит логика autosave (что неожиданно).
2. Раз закончили сливать ветки - переходим к разработке/ловле багов.


Общая мысль у меня следующая:
Я согласен с тем, что UI у ST перегружен и скоро его рожа треснет. Об этом нужно помнить, и пара идей о том, как место сэкономить у меня есть. Кроме того, в ST есть огромное кол-во зашитых констант, которые хотелось бы вытащить в настройки. От этого окно настроек вспухнет. Это, конечно, не такая большая проблема, как перегруженное главное окно. Но и время на кодирование всех кнопочек и ползунков тратить не хочется. Особенно сейчас. Поэтому, была мысль сделать с настройками следующее:

На данный момент для хранения настроек используется Qt'овский класс QSettings, который для линуксов хранит все в текстовом файле ( формате ini файлов, в правильной папке системы), а вот для Win - пихает все в реестр. Была идея заставить его хранить все в ini файлах для всех платформ. Для Win - в settings.ini в папке программы. В этом случае, вне зависимости от того, сделал ли я для редактирования того или иного параметра кнопочки/ползунки в программе, до них всегда будет можно добраться открыв settings.ini notepad'ом. И это гораздо быстрее реализовать - туда можно вывести все 100500 параметров, а потом уже думать, что из них и как нужно позволить менять из GUI. К примеру, эта компрессия TIFF. Если правильно помню, есть 30 алгоритмов сжатия, которые можно попросить использовать. Я поигрался - из них штук 8 реализованы библиотекой libtiff, используемой ST. Список того, из чего можно выбрать, может быть настраиваемым в ini файле. Вот тут я описывал, как это может выглядеть и предлагал код для этого: https://github.com/scantailor/scantailor/pull/267

Поэтому план у меня пока следующий:
1. Ребрендируемся в ST Universal (вы правы, конфиги оригинального ST переписывать нехорошо).
2. Я прикручиваю уже имеющуюся у меня реализацию toggle normalize illuminations, и может чего еще уже готового, что не порвет GUI.
3. Переходим на движок настроек на базе текстовых файлов ini формата.
4. Я разбираюсь с файлами локализации (потому что, если я начну добавлять настройки, и их текст придется локализовывать).
5. Зашиваю в настройки отключатели ненужного из кучи импортированного функционала. Выводим часть настроек в GUI.
5. Параллельно всему этому ловим и фиксим баги.

И еще, было бы здорово перевести обсуждение на страницы Issues в проекте на github:
https://github.com/trufanov-nok/scantailor/issues
И создавать по новой теме (issue) на каждый найденный баг или хотелку - чтобы я не забыл и мог конкретно по ней отписаться в теме. Можно на русском и коротенько. В общем, багтрекер сделать. А то я скоро начну путаться в показаниях Улыбка
Наверх
 
 
IP записан
 
m7876
Постоялец
**
Вне Форума



Сообщений: 104
Re: Modifikatsija ScanTailor
Ответ #32 - 14.09.2017 :: 05:34:37
 
Spasibo.

Polnostju soglasen i vsetselo podderzhivaju. V chastnosti, ideja s *.ini mne ocehnj nravitsja.

Github issues -- srazu posle sledujuschego Vashego reliza gotov nachatj zapolnjatj.

Kak Vam pomochj, krome testirovanija i "khotelok"?

Na Github ja "ashipunov", no tam malo moego (khotja pogljadite, vozmozhno, Vam ponravitsja Улыбка ), ono v osnovnom na CTAN (https://www.ctan.org/author/shipunov), CRAN (https://cran.r-project.org/web/packages/smirnov/index.html) i na sajte (http://ashipunov.info/shipunov/software/soft-en.htm).

(A tut http://forum.ru-board.com/topic.cgi?forum=5&topic=32945 ja -- "iit512". Tak poluchilosj.)

Da, esche, razumeetsja, biblioteka "Flora i fauna" (http://ashipunov.info/shipunov/school/sch-ru.htm) i tam moja knizhka o tom "Kak skanirovatj" (s ispoljzovaniem ST: http://ashipunov.info/shipunov/school/botanika/kak_skanirovatj.pdf).

Programmist iz menja sami vidite kakoj, C++ ja ne umeju. Mogu anglijskij (ja perevodchik R na russkij), mogu poprobovatj sobiratj i testirovatj dlja macOS (no ni razu ne proboval, prosto nemnogo rabotaju na Mac).

(Napisal vse eto, chtoby bylo ponjatnee, kak menja mozhno ispoljzovatj.)
Наверх
« Последняя редакция: 16.09.2017 :: 04:50:45 от m7876 »  
 
IP записан
 
xyz
Гуру
****
Вне Форума


Всем привет!

Сообщений: 899
Re: Модификация ScanTailor
Ответ #33 - 14.09.2017 :: 07:23:33
 
Ну вот, приехали.
При попытке экспорта STU  выдал:

...

и выпал.

Update.
повторный запуск дал тоже самое.  STF же работает штатно.

При этом STU никакую работу не начинает, даже папку экспорта не создает.
Наверх
« Последняя редакция: 14.09.2017 :: 14:22:42 от xyz »  
 
IP записан
 
xyz
Гуру
****
Вне Форума


Всем привет!

Сообщений: 899
Re: Модификация ScanTailor
Ответ #34 - 14.09.2017 :: 07:40:03
 
При повторной загрузке сохраненного проекта в STU проявляется странное поведение,

Когда я сохраняюсь, я стою на поcледней странице в режиме вывода и она обработана.

Когда я открываю проект, я нахожусь там же, но он считает страницу необработанной и начинает её делать по новой.

Цитата:
И еще, было бы здорово перевести обсуждение на страницы Issues в проекте на github:
https://github.com/trufanov-nok/scantailor/issues
И создавать по новой теме (issue) на каждый найденный баг или хотелку - чтобы я не забыл и мог конкретно по ней отписаться в теме. Можно на русском и коротенько. В общем, багтрекер сделать. А то я скоро начну путаться в показаниях


Давайте, пока идёт слияние и тестирование - лучше тут пообсуждаем. А вот когда улучшательные хотелки пойдут, тогда и перенесем. А то очень много всего там будет, да и отвалится по дороге половина.


Цитата:
А то я скоро начну путаться в показаниях

Ну можно тут какую-нибудь условную нумерацию наших репортов ввести:

daa-001   = баг     - исправлен
daa-002   = хотелка   - признана нецелесообразной
Наверх
 
 
IP записан
 
xyz
Гуру
****
Вне Форума


Всем привет!

Сообщений: 899
Re: Модификация ScanTailor
Ответ #35 - 14.09.2017 :: 07:49:55
 
В продолжение предыдущего бага.

Стал править искривление на предпоследней странице.
STU  последнюю страницу также объявид необработанной и сменил её иконку в ленте.


Пока вспомнил, раз про ленту. Баг из ветки основного ST.
При перезагрузке файла. (подмене или замене исходного изображения). В ленте вывода всегда продолжало висеть старое.  Нужны какое-то автообновление тумбнейлов (для замены).  и принудительное обновление (для подмены) исходников.




Наверх
 
 
IP записан
 
xyz
Гуру
****
Вне Форума


Всем привет!

Сообщений: 899
Re: Модификация ScanTailor
Ответ #36 - 14.09.2017 :: 08:26:56
 
1. Я в упор не вижу действие заявленных в STF "три красных точки" при распрямлении. Все версии (и ST тоже)  ставят 5 по линии.
Как пишет monday2000   "1. Delete_3_Red_Points The 3 central red points on the topmost (bottom-most) horizontal blue line of the dewarping mesh are now eliminated. "
Подскажите, куда глядеть, как вызывать ?


2.
Полез скачивать какую-нибудь старую версию ST (вдруг когда-то давно этих точек 7 было) и обнаружил, что после 9.11.1 были и 9.11.2  и 9.12   и уже даже 9.12.1

https://github.com/scantailor/scantailor/releases

Мейнтейнер там бинарные экзешники не собирает и не выкладывает.   

а) нельзя ли из исходного кода 9.12.1 там экзешник сделать ?
б) коммитсы - это принятые изменения ?   Если верить описанию, там есть несколько полезных от тулона по памяти, приоритетам, обработке ошибок.
Наверх
« Последняя редакция: 14.09.2017 :: 19:16:29 от xyz »  
 
IP записан
 
xyz
Гуру
****
Вне Форума


Всем привет!

Сообщений: 899
Re: Модификация ScanTailor
Ответ #37 - 14.09.2017 :: 09:44:03
 
Баг из разряда "Cтранное поведение STE"

Никогда за ним такого не замечал но, может, у меня исходники без черноты раньше были. Это поведени есть и в STE и в STU.

На стадии "полезная область". Поле Borders in mm.
Если чуть выше Borders нажато Disable, то на цифры в ячейках он никак не реагирует.  Если нажато Автомат, то помимо заданных мной полей, он начинает срезать снизу черноту. (по бокам вроде нет.)
Т.е. у меня не получается сделать чистую обрезку, которую я много раз в STE и делал   (но вполне может быть, что черноты снизу у меня раньше и не было.)

Мне кажется было бы правильным сделать так:   если нажато disable  выше borders, то  должна идти чистая обрезка. Если включен автомат, то пусть ищет, что ищет.

PS
(Ну и как мне такие замечания на гитхаб класть ?)
Наверх
 
 
IP записан
 
xyz
Гуру
****
Вне Форума


Всем привет!

Сообщений: 899
Re: Модификация ScanTailor
Ответ #38 - 14.09.2017 :: 11:31:05
 
Переполз на Windows 7.

Там до кучи запускаю ST Advanced  (некая сборка от 4lex4, и, судя по всему,  он в ней к STE qt5 прикручивал и кое-что почти всё кроме экспорта слоёв из STF взял). А также запускаю ST-experimental Тулона.   
(И то, и другое выложено в конце ветки на руборде
http://forum.ru-board.com/topic.cgi?forum=5&topic=32945&start=1860)
Заскриншотил основные интерфейсы STA
http://rgho.st/8MZx8ycVX
Любопытно, что там есть некий выпадающий список threshold method   при черно/белом и смешанном выводе, но он  пустой.



1) Увидел/вспомнил, что такое инструмент "3 точки" от monday2000. 
Это когда при распрямлении, только-только перещёлкиваешься на эту закладку, выставленный по умолчанию прямоугольник сетки   обозначен всего 4 точками по углам. (средних трёх нету). 
И тогда, если эти точки были лишние - то их уже удалять не надо, а только ставить новые.


Не уверен что это удобно. искривления бывают разные.
Я честно говоря, уже привык предустановленные точки двигать.  Может, тут также сделать  включение/выключение опциональным ?

Update:  подумал, и решил, что "без три точки", т.е. как в STF, так, действительно, тут удобнее



2) В STA   в настройках включается аппаратное ускорение OpenGL   в STU оно остается задизейбленным.
(в официальном ST  самой кнопки "настройки" нет.)


3) Точно также не пошел экспорт. Сообщение об ошибке в Win 7 было подробнее:


Сигнатура проблемы:
  Имя события проблемы:      APPCRASH
  Имя приложения:      scantailor.exe
  Версия приложения:      0.0.0.0
  Отметка времени приложения:      00000000
  Имя модуля с ошибкой:      QtCore4.dll
  Версия модуля с ошибкой:      4.8.6.0
  Отметка времени модуля с ошибкой:      00040008
  Код исключения:      40000015
  Смещение исключения:      0000f2a9
  Версия ОС:      6.1.7601.2.1.0.256.48
  Код языка:      1049
  Дополнительные сведения 1:      79e0
  Дополнительные сведения 2:      79e02452e87da72d94e6b4eec27e7125
  Дополнительные сведения 3:      04cd
  Дополнительные сведения 4:      04cd32022b200518c23636c8725d5359
Наверх
« Последняя редакция: 14.09.2017 :: 19:19:10 от xyz »  
 
IP записан
 
xyz
Гуру
****
Вне Форума


Всем привет!

Сообщений: 899
Re: Модификация ScanTailor
Ответ #39 - 14.09.2017 :: 12:41:07
 
Заскриншотил  ST-experimental
http://rgho.st/92JQtvlsr


В общем, это клёво. Имеет смысл внедрить.

а) Наконец-то появились настройки, и в настройках - OpenGL ускорение.

б) иконки для типов искажений. Переносить их конечно на 3 этап - непривычно и малополезно. Но раз у нас образуется уже четыре (а то и пять) схем коррекции:  3 точки/не три точки/стандартный/кривульки по бокам - иконки это вариант.
Я не знаю, как алгоритмически Тулон сделал кривульки. Но визуально - у меня его  стандартный и его (не от monday2000) кривульки  различаются только числом точек. ("Кривульки", так как он эту кнопку "curved lines" обозвал)  (А у monday2000точки для кривулек смещены в сторону переплета.) Так что, может, тут и все пять вариантов получаются.


в) что касается отказа от  дпи - непривычно, но многие так выходной результат и выбирают. И этим можно стандартную схему выбора дополнить. А самое любопытное тут есть индикация пиксельных размеров !

г) схема с процентами и match scaling - крутотень.
(при этом поля подсвечиваются желтоватым !)

1) это позволяет обрабатывать фото-сканы.
2) это позволяет подгонять обложки.
3) когда-то давно мне это было нужно для сведения старых учебников, отксерокопированных на аппаратах, делающих разный и неточный масштаб  60-70-90%
 
Я, пожалуй, напишу эссе, как именно я с обложками и полями извращаюсь, чтобы было попонятнее, что я делаю и чего тут лично мне для лично моей мечты не хватает.

(Я об этой своей хотелке писал тулону/оранжу году эдак в 2008, когда он только-только начал свой проект и только интерфейс проектировал, и вот наконец-то дождался).

Если вкратце, тут не хватает кнопки, уменьшать или увеличивать надо размеры путём шкалирования. И переключения с процентов на миллиметры/пиксели.


д)  В описание программы он включил references  - ссылки на статьи с алгоритмами.
Наверх
« Последняя редакция: 14.09.2017 :: 19:15:55 от xyz »  
 
IP записан
 
truf
Активист
***
Вне Форума



Сообщений: 254
Re: Модификация ScanTailor
Ответ #40 - 14.09.2017 :: 20:14:03
 
m7876 писал(а) 14.09.2017 :: 05:34:37:
Kak Vam pomochj, krome testirovanija i "khotelok"?


Пока никак. Вот когда программой уже можно будет пользоваться на постоянной основе, будет очень важен фидбек, и можно будет думать про MacOS и докуменацию..

xyz писал(а) 14.09.2017 :: 08:26:56:
а) нельзя ли из исходного кода 9.12.1 там экзешник сделать ?

В той же папке выложил 9.12.1
https://cloud.mail.ru/public/D52v/sxom8RQiN

xyz писал(а) 14.09.2017 :: 08:26:56:
б) коммитсы - это принятые изменения ?   Если верить описанию, там есть несколько полезных от тулона по памяти, приоритетам, обработке ошибок.


Это master-ветка. Я уже вытащил оттуда все нужное. Оно слито начиная с EFM (enhanced+featured+master). Сегодня постараюсь выложить Win версию с этими улучшениями + моими доделками.

xyz писал(а) 14.09.2017 :: 11:31:05:
также не пошел экспорт


Это я исправил, со сл версии должен заработать.

Если будете удалять uninstall'ятором прошлую ST EF версию - он забудет удалить 2 dll'ки. Можете удалить их руками, или перезаписать при установке 9.12.1 Я это поправил - с этого момента, все библиотеки должны удаляться корректно. Со сл версии программа буде ставиться в папку Scan Tailor Universal, чтобы не переписывать обычный ST.
Наверх
 
 
IP записан
 
truf
Активист
***
Вне Форума



Сообщений: 254
Re: Модификация ScanTailor
Ответ #41 - 15.09.2017 :: 03:02:19
 
xyz писал(а) 13.09.2017 :: 23:07:18:
8)  Как я и говорил о разных результатах версий.
Кусок паразитной тени  при смешанном выводе   STE    и STE+F   включили в зону картинки , а ST  и STF   - нет.


Действительно отвратительно ведет себя автодетект картинок в SE. Это они накатили себе коммит "stretch filled holes and set threshold to 32" в 2011 году, вот "stretch filled holes" и дал такой эффект. Я верну как было в master.

Кстати по поводу threshhold. Они ставили себе 32 вместо 26, но у меня сейчас, как в последнем master - 48 Улыбка (для автодетекта).
threshhold - это число от 0 до 255 (1 байт), представляющее собой границу отделения белого от черного для 256 оттенков серого. Вот тот threshhold, что крутится в программе от -50 до 50 - он прибавляется к 128 (пол байта), и служит для разделения текста и фона. А вот настроить threshhold автодетекта картинок ST не даёёёт... А иногда очень хочется, на темных сканах. Я к тому, что таких хитрых параметров, которые можно покрутить и получить интересный результат - зашита куча. Все их нужно достать и положить хотя бы в ini файл настроек.
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5570
Екатеринбург
Пол: male
Re: Модификация ScanTailor
Ответ #42 - 15.09.2017 :: 05:40:13
 
truf писал(а) 15.09.2017 :: 03:02:19:
Я к тому, что таких хитрых параметров, которые можно покрутить и получить интересный результат - зашита куча. Все их нужно достать и положить хотя бы в ini файл настроек.

...и получится у вас тот же самый СканКромсатор, который ругают за сложность... ИМХО, СканТейлор был создан как простая альтернатива.
Это я так, даю взгляд со стороны. Не для обсуждения.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
balik2
Активист
***
Вне Форума


Всем привет!

Сообщений: 226
Пол: male
Re: Модификация ScanTailor
Ответ #43 - 15.09.2017 :: 10:59:22
 
скантейлор отлично подходит на этапе разрезки и форматирования сканов. на этом этапе он намного удобней сканкромсатора

а дальше конвертацию в ч/б  и работу с зонами надо делать в сканкромсаторе, тут он вне конкуренции на сегодня по настройкам
Наверх
 
 
IP записан
 
xyz
Гуру
****
Вне Форума


Всем привет!

Сообщений: 899
Re: Модификация ScanTailor
Ответ #44 - 15.09.2017 :: 11:32:53
 
Сочинил "рассуждение об обложках":

http://rgho.st/8qHcxYLfQ
Наверх
 
 
IP записан
 
truf
Активист
***
Вне Форума



Сообщений: 254
Re: Модификация ScanTailor
Ответ #45 - 15.09.2017 :: 15:19:39
 
xyz писал(а) 13.09.2017 :: 21:49:28:
3). Наверное, это баг. Но, может, так и задумано. Оно так работает и в исходном STE.   Команда Apply cut  работает только для отрезания полосы. При разрезании разворота положение разреза не дублируется.   Либо дать возможность   распространять среднюю линию при развороте, либо для разворота задизейблить чекбокс Apply Cut


Там проблема хитрее. Эта функция сработает только на тех сканах, которые с точностью до пикселя совпадают размером с тем, разрезы которого предполагается скопировать. И должен совпасть угол поворота, выполненного на предыдущем шаге. Не совпадающие по размеру сканы при отрисовке забраковывают эти разрезы и делают свои автоматические. Я пытался это исправить, но застрял на геометических преобразованиях. Простого пропорционального изменения координат оказалось недостаточно. Отключу ее пока. Может потом разберусь.
Наверх
 
 
IP записан
 
xyz
Гуру
****
Вне Форума


Всем привет!

Сообщений: 899
Re: Модификация ScanTailor
Ответ #46 - 15.09.2017 :: 15:30:27
 
Ну, как правило, это применяется для оптикбука - т.е. все сканы идентичные по размерам, а только книга вращается на сканере.

А если просто брать координату пересечения прямой верхней стороны, и её наклон. Так из этой точки и проводить.  Будет смещение на скане другого размера - значит будет.
Если же случится так, что координата уползёт за пределы рисунка - значит без реза.
Наверх
 
 
IP записан
 
truf
Активист
***
Вне Форума



Сообщений: 254
Re: Модификация ScanTailor
Ответ #47 - 16.09.2017 :: 00:10:35
 
По ссылке можно скачать Win32 сборку текущей версии.
https://cloud.mail.ru/public/D52v/sxom8RQiN

От FE версии отличается она следующим:

1. Внесены все правки, произошедшие в основном проекте с момента отделения E и F от него.

2. Проект переименован в Scan Tailor "Universal", ставится в соответствующую папочку. Хранит настройки в Scan Tailor Universal.ini не мешая ST.

Внесены мои уже готовые правки и хотелки, которые в течение года я подготовил для ST:

3. Оригинальный ST падает при обработке некоторых сканов, не имеющих полей (например фотография на всю страницу). Баг описан тут. Я его исправил, но это не точно. Если найдется такой скан, на котором проблема повториться - высылайте.

4. Добавлено контекстное меню для режима ручного Dewarp'а, позволяющее сбросить измененную кривыми руками сетку назад к первоначальному виду. Полезно, если хочется начать менять её заново с нуля. Проблема описана тут.

5. Я добавил себе 2 режима сортировки на этапе Output. Первый - сортировка по Mode (b/w, color, mixed с учетом их настроек). Позволяет сгруппировать,скажем все mixed страницы и поменять им threshhold, отдельно от threshhold b/w страниц. Жутко меня это бесило, что при изменении threshhold всем страницам у них слетает mode. Второй - "grayscale sources first", позволяет сгруппировать страницы по признаку grayscale/color у скана. Замечу - у оригинального файла скана, а не b/w\color режиму в Output. Полезно для книг с цветными иллюстрациями (я сканирую страницы с иллюстрациями в цвете, а страницы, содержащие только текст - в сером) и позволяет массово выбрать цветные сканы и поменять им дефолтный b/w на color или mixed.

6. Добавил следующую свою фичу (надо же и свои хотелки реализовывать, к тому же у меня свой Disable Normalize Illumination было с ней слито). Это т.н. color layer в режиме mixed. Как правильно писал
@
xyz, ST не всегда спавляется с бинаризацией. Я считаю,что это не всегда возможно в принципе. Поэтому, родилась идея - использовать инвертированный результат, полученный из режима b/w, в качестве маски в режиме mixed. Это выглядит, как если бы автодетектер картинок выделил вам не только картинки, но и весь текст, игнорируя фон. В результате можно получить скан с grayscale или цветным текстом, но при этом с монотонным белым фоном. Реализовано оно в качестве дополнительного слоя в mixed mode. Т.е. там теперь 2 checkbox'a: Auto layer для картинок (вкл по-умолчанию) и Color layer для всего что не фон (выкл по-умолчанию). И в контекстном меню есть возможность баловаться с регионами обоих слоев. Например, если я встречаю цветной текст, стрелку или рамочку, я врубаю color layer, выделяю все, кроме  цветного текста рамочкой, и вычитаю этот регион изо всех слоев. Все становится b/w, а цветной текст обрабатывается как картинка. В общем, подробно фича описана с картинками-примерами тут.
Но. color layer в 1.5~2 раза увеличивает время обработки страницы (т.к. по-сути он требует дополнительного выполнения части операций, характерных для режима b/w). Он не поддерживается в режиме Dewarp отличном от OFF. (потому что я им не пользуюсь в ST вообще, и там были какие-то тех сложности с получением dewarped маски). Не все возможные команды работы с регионами есть в контекстном меню редактора. (но мне хватило). И все три слоя (b/w, autolayer, color) используют одну настройку threshhold. Ну autolayer она вообще не нужна, а вот b/w и color за нее конкурируют, т.к. color использует b/w маску, зависящую от того же значения threshhold.
Ну и, наконец, то что вы получили скан с цветным/серым текстом в том же качестве, что и в оригинале, не значит, что этот текст не пережмет в серое месиво djvu.
Так что прошу относится к функции, как к способу сохранения цветных надписей/рамок/стрелок (или особо мелкого текста), а не борьбы с плохой бинаризацией текста.
Функция - моя любимая личная хотелка, удалять не буду Улыбка

7.  Вместе с этими слоями в Mixed режиме и даже в Color режиме появились настройки White margins/ Normalize Illumination. Последнее enabled только при включенном первом. Они позволяют баловаться нормализацией на отдельно взятом скане. Есть случаи (большинство), когда нормализация запарывает картинки. А есть (реже) - когда нет, и позволяет точнее автоматически определять зоны картинок. Режимы эти явл частью настроек color/mixed режимов и копируются вместе с ними через Apply to..
Функция Disable Picture Normalization, приехавшая из ST Plus и находившаяся в настройках, убрана. Вернее, checkbox остался, но не работает. Он конфликтует с вышеописанным. Он будет переделан в настройку, описывающее дефолтное положение этого режима для новых сканов в проекте/новых проектов.
8.
xyz писал(а) 13.09.2017 :: 23:07:18:
8)  Как я и говорил о разных результатах версий.
Кусок паразитной тени  при смешанном выводе   STE    и STE+F   включили в зону картинки , а ST  и STF   - нет.

Починено.

9. Apply cut пока скрыт. По вышеописанным причинам. Вернусь к нему позже. Там все не так просто, как хотелось бы.

10. ST U перешел на хранение настроек в "Scan Tailor Universal.ini" вместо реестра в Win. Где-то в Common FIles или AppData он лежит. Лучше поиском искать. Это дефолтное поведения класса QSettings в Qt - не держать настройки в папке с программой, а размещать в спец папках Win. Это позволяет сохранить их при переустановке программы. Т.е. они не чистятся uninstall'ятором.
Для linux все по-старому.

11. Разработка переехала в ветки dev/master на github. Но я иногда ломаю последовательность коммитов (два раза за сегодня). Если на сайте последний коммит отличается от вашего (т.е. разработка ушла вперед). А git pull не помогает, т.к. последовательность коммитов сломана. То поможет:
Code:
git checkout master
git fetch --all
git reset --hard origin/master
или
git checkout dev
git fetch --all
git reset --hard origin/dev
для dev ветки
 



Это полностью заменит ваши ветки dev/master содержимым с сервера.

12. Добавлен checkbox "Remember my choice" в так полюбившийся многим диалог StartBatchProcessing. Позволяющая скрыть его навсегда. Ну или пока в ini файле назад его не включите.

13. Функция Export для страниц должна перестать падать.

О птичках:
Я уже писал, что у GUI ST скоро рожа треснет, держа в уме, что я напихаю в него еще больше настроек (colorlayer, normalization). GUI, конечно же будет переделано. Вариантов много.Сходу, у меня есть претензии к жирноте набора контролов, управляющих threshgold'ом и кнопок Apply to.  Так что, не пугайтесь.

Баги в программе остаются. Один у меня воспроизводится только в Win виртуальной машине, а на linux все нормально, что меня дико бесит. Так что, все еще сырое.

Локализация пока не поправлена.

xyz писал(а) 14.09.2017 :: 11:31:05:
2) В STA  в настройках включается аппаратное ускорение OpenGL   в STU оно остается задизейбленным.
(в официальном ST  самой кнопки "настройки" нет.)


В ST Plus автор ее тоже включил вроде. Оттуда я ее приволок. Она и в официальном ST есть, но благоразумно скрыта, т.к. для того чтобы OpenGL работал, нужна сборка с включенным при компиляции режимом OpenGL. А это удваивает кол-во дистрибутивов. Скорее всего, потянет дополнительную библиотеку. В комментах писали авторы, что он нестабилен на части оборудования - но думаю, за 5 лет все уже норм.
Но главное - это ничего не дает. Все алгоритмы обработки изображений будут работать по-старому. Ускорение будет только у контрола, отображающего картинку-результат в самый последний момент. Он в одну строчку кода на OpenGl переходит, поэтому этот режим и добавили - это ничего не стоит с т.з. разработчика. Но OpenGL хорош, когда вы в этом контроле 3D анимацию крутите, постоянно трансформируя систему координат. А ST ничего тяжелее мерцающего синего подсвечивания определенных регионов в mixed mode не отображает.  Поэтому, никакого эффекта от его включения не будет. В конце концов, я сделаю сборку с включенным OpenGl для желающих, но сейчас это делать и тестировать бессмысленно.
Наверх
 
 
IP записан
 
xyz
Гуру
****
Вне Форума


Всем привет!

Сообщений: 899
Re: Модификация ScanTailor
Ответ #48 - 16.09.2017 :: 02:48:41
 
Просто подарок на день рожденья какой-то  Улыбка

Об итогах тестирования отпишусь.

Пока несколько, возможно, бесполезных соображений.

1. Хорошо бы в первом приоритете попробовать начать интегрировать Plus. Может и не в полном объеме, но:

а) там в настройках сделана панель с закладками (и даже аж двухуровневыми !), и теоретически, многие контролы можно временно помещать туда, чтобы не перегружать интерфейс главного окна. В том числе контролы разных версий или контролы разных тестируемых новых инструментов разносить по разным закладкам.
Грубо говоря, будет на каждой закладке столбик чекбоксов.

б) там есть важное для практического кодирования управление порогом бинаризации. Тогда те люди, кто версией плюс пользуются, смогут Universal не в режиме тестирования, а в режиме регулярного использования юзать. Больше накопают.

Сложное же автосохранение оставить на попозже.


2. Как, наверное, понятно из моих предыдущих постов, мне кажется, что было бы неплохо в будущем интегрировать пару ништяков и из experimental.


3. У меня почему-то ощущение, что интеграцию можно будет тогда считать полной, если будет возможность дизейблить ненужные функции из Enhanced.

Как они перечислены в ROADMAP  (только нумерацию добавил):

1. Enhanced
1.1. pop out thumbnail and control windows    
- сделать отключаемой

1.2. Apply to this page and the following every other page
- OK, полезно

1.3. apply to every other selected page 
-  OK

1.4. Split Pages: Apply Cut   -  обнаружилась проблема   
- OK, полезно

1.5. Content Box disable   -  OK
1.6. Page Box            
- OK, «Borders in mm» просто очень  полезно

1.6.1. Fine Tune page corners -
???   может, эту одну галочку сделать убираемой ???

1.6.2. disable/auto/manual 
-  OK

1.7. Auto margins
   - сделать отключаемой

1.8. alignment: auto, manual, original   
- сделать отключаемой

1.9. Tiff compression options (LZW, Deflate, Packbits, JPEG) 
–   перенести в настройки

1.10. Picture Shape: Free / Rectangular - 
OK


(и в RM пропущено)
1.11  Deviation patch   (красные звездочки на нетипичных)   
- сделать отключаемой

1.12  StartBatchProcessing
–   полностью перенести в настройки




4. Прошу в приоритете задизейблить пункт 1.1. из списка выше. Непривычный интерфейс мешает. Прямо ничего крутить и проверять даже не хочется.
Зоны цеплялок сжирают полезное место.
Вертикальные палки (думаю, что они связаны с этим же пунктом) между "инструментами -окном -лентой" жутко раздражают.


5. В описании версии Enhanced есть такой пункт:
"Matchlayout patch adds --match-layout options to cli version which detects atypical pages and does not match their size with others automaticaly. "

Не могу понять. Это имеется в виду пункт 1.8. из списка, или есть какое-то скрытое незаметное поведение ?


6. По вопросу OpenGL: не могу судить объективно, но под виндоус7  по ощущениям STA  работает (откликается) шустрее, чем ST. И, как писали на руборде,  это даёт более быстрые реакции интерфейса.  Хотя там QT5, конечно.

7. Сейчас буду разбираться, как работают ваши лейеры. Но неоднократно в СТ замечал, и даже, кажется, на каком-то форуме об этом писал.  Часто СТ картинку автоматом определяет неправильно. А бинаризует её контуры верно. И вот если бы она такой маской отправлялась в слой картинки, то было бы здорово.
Но тут не нужен новый слой. Тут при выделении контура картинки руками, надо через контекстное меню сказать, что внутри надо найти картинку по маске.

8. Возникает вопрос, как ваши лейеры будут взаимодействовать с функцией экспорта ?
а) будет экспортироваться три слоя ?  (что имеет смысл для кодирования "надписей/рамок/стрелок" малоцветом)
б) будет предусмотрена возможность слияния  слоёв ?

9. Сразу вижу, что в режиме вывода кнопка "применить" общая. А её видимо надо будет размножить по функциям.

-------------------------



10. БАГ !  Переобрабатываю вчерашний проект. На стадии вывод прошла обработка файлов в режиме Mixed, но в ленте часть файлов (почему часть ?)  обработанными не отобразилась, STU выпал.
Параллельно работающий СТ выдавал сообщение "нехватка памяти".

11. Запускаю повторно. Такая же картинка. Обработка проходит. При попытке экспорта уже для первой страницы сообщает, что "файл не готов".
Наверх
« Последняя редакция: 16.09.2017 :: 04:00:59 от xyz »  
 
IP записан
 
truf
Активист
***
Вне Форума



Сообщений: 254
Re: Модификация ScanTailor
Ответ #49 - 16.09.2017 :: 03:00:22
 
xyz писал(а) 16.09.2017 :: 02:48:41:
10. БАГ !  Переобрабатываю вчерашний проект. На стадии вывод прошла обработка файлов в режиме Mixed, но в ленте часть файлов (почему часть ?)  обработанными не отобразилась, STU выпал.
Параллельно работающий СТ выдавал сообщение "нехватка памяти".


Если есть возможность, и можно выделить небольшое кол-во страниц в проекте, на которых проблема воспроизводится, то залейте мне их вместе с проектом сюда: https://cloud.mail.ru/public/6pag/kdUTyCyWK
Боюсь, это та же проблема,что я смог воспроизвести на Win,но не на линуксе. Я пока на виртуальной машине Win отладчик поставить не смог, чтобы ее посмотреть.
Наверх
 
 
IP записан
 
xyz
Гуру
****
Вне Форума


Всем привет!

Сообщений: 899
Re: Модификация ScanTailor
Ответ #50 - 16.09.2017 :: 03:21:30
 
Кручу я вот эти файлы (инструкцию по замене ролика на ScanSnap после 100.000 страниц пробега):

http://dropmefiles.com/AkOAL

Проблема воспроизводится с первой страницы: в ленте обновлений нет.  Отражается только 3 страница (левая половина второго скана)
Но он реально память жрёт, так что система подвисает.


Update
сделаю проект - залью
Наверх
 
 
IP записан
 
xyz
Гуру
****
Вне Форума


Всем привет!

Сообщений: 899
Re: Модификация ScanTailor
Ответ #51 - 16.09.2017 :: 03:29:55
 
Пытаюсь сделать одну страницу.
Перещелкиваюсь после  её поворота на шаге 1 на этап 5.

Так вот ST   сразу её разделяет   (т.е. применяет на шаге 2 автомат).
А вот STU  разворот определяет как одну страницу, и на шаг 2 надо ручками вернуться.
Наверх
 
 
IP записан
 
xyz
Гуру
****
Вне Форума


Всем привет!

Сообщений: 899
Re: Модификация ScanTailor
Ответ #52 - 16.09.2017 :: 03:51:08
 
Что-то невероятно долго он обрабатывает.
Застрял  (и завис).

Лента не обновлялась. Обработанные файлы в папку при этом STU положил. Попытки экспорта при повторном запуске всё равно проваливаются.

Ваш mail.ru  пишет  "загрузка на публичной странице невозможна".

Одностраничный проект положил сюда:
https://yadi.sk/d/RxhStzNI3MvvFs


Да, кстати. В реальности, мои файлы это 600 дпи, которые объявлены 300 дпи. (Можно считать, что я тут A3 отсканировал.) И оригинальный ST от меня требует, чтобы я файлы объявил 400 дпи.
Наверх
 
 
IP записан
 
xyz
Гуру
****
Вне Форума


Всем привет!

Сообщений: 899
Re: Модификация ScanTailor
Ответ #53 - 16.09.2017 :: 03:59:40
 
В продолжение обсуждения.

12.  Может на ру-борде выложить как заработает ?
Заодно и ST 9.12. там разместить ?

13. Хорошо бы по поводу прямоогульных выделений всё-таки определиться. Они в STU работают так, как в плюсе или нет ?  Алгоритмы различаются ?

Может встроить алгоритм плюса в дополнение к текущему, чтобы сто проектов не запускать, а просто по жизни понаблюдать, как он себя ведет ? Есть или нет различия ?
Наверх
 
 
IP записан
 
xyz
Гуру
****
Вне Форума


Всем привет!

Сообщений: 899
Re: Модификация ScanTailor
Ответ #54 - 16.09.2017 :: 04:32:27
 
14.
Кстати, может это и STU тогда орал о нехватке памяти.
Там просто в шапке предупреждения стоит
"Scan Tailor:  нехватка памяти."
Сейчас он один был запущен (с одной страницей)
и тоже такое выдал и выпал.

15.
Я при этом игрался вашими слоями. Пытался понять. Какие возникают ли отличия в изображении, в зависимости от того как стоят галочках на слоях авто и вашем грей:   1-1,  0-1,  1-0.

а)   Мне кажется, что справа, где закладки заливки, картинок и пр. надо сделать какую-то закладку и для вашего слоя, чтобы была возможность посмотреть, надо или нет его подключать к основному. То есть какое-то сравнение вкл/выкл, а не обработка по полной снова без возможности сравнения

б) вкл/выкл слоя авто приводит к появлению/пропаданию списка Picture shape  и это дергает весь интерфейс.

в) я пока до конца не разобрался, но не кажется ли вам, что слой "грей" сейчас - это новый режим вывода, а не слой ?

г) прочитал описание, но так и не понял. Я проэкспериментирую и пойму, конечно, но просто пока падает Печаль 
Вот картинка попала в авто, не попала в грей. Что я увижу в итоге (при разных комбинациях чекбоксов) ? Если я хочу текст с картинками - я в грей должен расставить ч/б зоны ? Если у меня есть пирог    авто - грей - ч/б, как получить на конечном изображении все три типа участков ?

16.
Может, стоит временно слой грей откатить, чтобы удостовериться, что STF-экспорт штатно работает ?
Наверх
« Последняя редакция: 16.09.2017 :: 04:42:53 от xyz »  
 
IP записан
 
truf
Активист
***
Вне Форума



Сообщений: 254
Re: Модификация ScanTailor
Ответ #55 - 16.09.2017 :: 04:54:34
 
xyz писал(а) 16.09.2017 :: 03:59:40:
12.  Может на ру-борде выложить как заработает ?
Заодно и ST 9.12. там разместить ?


C 9.12 делайте, что пожелаете. Но он не стоит выкладывания - изменений там практически нет. К тому же, я собрал только x86. А ST U - пилить и пилить.

xyz писал(а) 16.09.2017 :: 04:32:27:
б) вкл/выкл слоя авто приводит к появлению/пропаданию списка Picture shape  и это дергает весь интерфейс.


Специально сделал - интерфейс не резиновый, а Picture shape имеет смысл только при автоопределении изображений. Т.е. при включенном авто-слое.

xyz писал(а) 16.09.2017 :: 04:32:27:
в) я пока до конца не разобрался, но не кажется ли вам, что слой "грей" сейчас - это новый режим вывода, а не слой ?


Теоретически можно и так, но на практике зачастую я использовал оба слоя. Некоторые вещи auto layer ловит лучше чем грей, некоторые наоборот. Лишнее отрезается полиномами.
Грей слой - это просто b/w режим в роли маски. Он заточен под поиск всего серого по threshhold'у. А автослой - под поиск серых площадей (а если Picture hape включить-то еще и определенной формы). Соответственно, автослой лучше ищет картинки, но не ищет текст - т.к. площадь букв маленькая. А грей слой - берет все, но с большей вероятностью может оставлять белые пятна в картинках, т.к. на площадь ему все равно, а изображенное на картинке может уйти в белый цвет. В итоге они просто суммируются и дополнят друг друга, если нужно. А потом лишнее вырезается полигонами - изо всех слоев в b/w режим, или только из автослоя. Вырезание только из грей слоя я по-моему не делал за ненадобностью.

xyz писал(а) 16.09.2017 :: 04:32:27:
Вот картинка попала и в авто и в грей. Что я увижу в итоге ?


Картинку. Воспринимайте и грей и авто - как две маски для отличения цветного и ч/б, по разным принципам полученные, которые в итоге суммируются. Но до того вы можете из этих масок что либо повырезать. Точнее: либо из маски автослоя (грей под ним останется если есть - но тут еще один косяк реализации, подсветка в этой области пропадет. по хорошему их надо разным цветом сделать). Либо из обеих масок сразу (и на этом месте будет ч.б.). Там пока сильно не хватает контролов на все варианты, но я, зная как оно на самом деле устроено, и с имеющимися контролами все необходимые комбинации картинок/цветного текста выжимал.
Наверх
« Последняя редакция: 16.09.2017 :: 05:16:21 от truf »  
 
IP записан
 
m7876
Постоялец
**
Вне Форума



Сообщений: 104
Re: Modifikatsija ScanTailor
Ответ #56 - 16.09.2017 :: 04:55:26
 
xyz писал(а) 15.09.2017 :: 11:32:53:
Sochinil "rassuzhdenie ob oblozhkakh":

http://rgho.st/8qHcxYLfQ


Spasibo. Interesno. Sam tak ne delaju, no, kazetsja, v ostovnom iz-za leni i neobrazovannosti.
Наверх
 
 
IP записан
 
xyz
Гуру
****
Вне Форума


Всем привет!

Сообщений: 899
Re: Модификация ScanTailor
Ответ #57 - 16.09.2017 :: 05:11:33
 
Цитата:
В итоге они просто суммируются и дополнят друг друга, если нужно.


Вот только принцип "если нужно" может быть разным:
...

Идею я понимаю, спасибо. Просто запустить посмотреть не получается.



17.

Про малоцвет. В СТ уже есть пипетка в заливке.  (заливка цветом по образцу).
Может и здесь тоже добавить включение в слой грей не просто по серому порогу, но того, что отклоняется по цвету ?
Наверх
 
 
IP записан
 
slava_kry
Гуру
****
Вне Форума



Сообщений: 557
Re: Модификация ScanTailor
Ответ #58 - 16.09.2017 :: 08:16:50
 
Я тут влезу со своим вопросом.
Как-то автора спрашивали насколько сложно сделать, чтобы прямоугольник "полезной области" можно было таскать именно как прямоугольник? Автор ответил, что очень сложно...
Это и правда так? Если да, то и ладно. Улыбка
Если же всё же не столько сложно, то хотелось бы увидеть.
Наверх
« Последняя редакция: 16.09.2017 :: 10:34:43 от slava_kry »  

Он сказал им: вы выказываете себя праведниками пред людьми, но Бог знает сердца ваши, ибо что высоко у людей, то мерзость пред Богом.
 
IP записан
 
xyz
Гуру
****
Вне Форума


Всем привет!

Сообщений: 899
Re: Модификация ScanTailor
Ответ #59 - 16.09.2017 :: 10:20:14
 
18.
Это действительно работа с памятью.
Снизил выходное разрешение в одностраничном проекте до 300 и он обработался, лента обновилась.

(Но на самом деле это странно, так как STE позавчера спокойно всё делал.)

Экспорт тоже прошёл.





Наверх
 
 
IP записан
 
Страниц: 1 2 3 4 ... 18
Послать Тему Печать