OCR форумы Добро пожаловать, Гость. Пожалуйста, выберите Вход или Регистрация
Всем привет!
Hi all!
 
  ГлавнаяСправкаПоискВходРегистрация Администратор Библиотека  
 
Страниц: 1 ... 11 12 13 14 15 ... 18
Послать Тему Печать
Модификация ScanTailor (Прочитано 300353 раз)
truf
Активист
***
Вне Форума



Сообщений: 254
Re: Модификация ScanTailor
Ответ #360 - 27.01.2018 :: 02:07:11
 
Мне попались в лапы чужие сканы в приличном разрешении. Но в книге была только треть страниц в малоцвете, а автор сканов все отсканировал в цвете. А не как я люблю - все в grayscale, кроме страниц, где color действительно нужен.

В итоге на этапе output я не мог автоматически разделить их с помощью сортировки gray sources on top и массово применить смену режима на Mixed. И переключаться между страницами было долго. Поэтому я создал djvu в низком dpi, где все страницы были в color, и вручную просмотрел его, выписывая номера (и диапазоны) страниц, в которых color действительно нужен.

После этого, я прикрутил к ST Universal функцию выделения страниц по их номерам. Скопировал текст с моими записями туда - выбрал все нужные страницы разом, и применил к выбранным смену режима.

Конечно, в теории, я мог бы и не вручную djvu просматривать, а изобрести какой-то счетчик цветов. Но на все случаи жизни сортировок и функций не придумаешь, а в ST все равно не было интерфейса для передачи ему подмножества страниц из внешней программы. Так что, теперь такой интерфейс есть, и это должно быть полезно.

Технически новая команда вызывает окошко, в которое можно скопировать текст с номерами страниц. Нумерация начинается с 1. Нумерация не зависит от текущей сортировки - т.е. страница 1 будет всегда соответствовать первому thumbnail при сортировке normal order. Текст может быть многострочным. ЛЮБЫЕ символы кроме : и - (в окружении пробелов или без) трактуются как разделители номеров. Символы : и - трактуются как диапазон страниц. Это сделано для того, чтобы можно было колонку номеров скопировать, например из Excel, безо всякого форматирования. И вообще копировать списки страниц откуда угодно в любом формате. В окошке также будет динамически писаться сколько номеров страниц ST понимает из вашего текста, так что в real time можно за этим следить.

К этой фиче до кучи сделана функция перехода на страницу по её номеру. Тоже отдельной командой в контекстном меню ленты страниц.


Обе фичи залиты в github и доступны пользователям linux. Бинарники Win пока из-за такой мелочи пересобирать не стал.

Наверх
 
 
IP записан
 
m7876
Постоялец
**
Вне Форума



Сообщений: 104
Re: Модификация ScanTailor
Ответ #361 - 27.01.2018 :: 06:35:58
 
Я в таком случае просто загружаю все в IrfanView и конвертирую. Irfan безумно быстр и может делать кучу всего другого (скажем, добавить правильное разрешение в перефотографированные сканы). В какой-то мере это UNIX-way, где каждая программа делает что-то одно, но хорошо. (Счетчик цветов есть, кстати, в ImageMagick / GraphicsMagick).
Я просто недавно поймал себя на том, что не хочу пользоваться STU и STA. Второй вообще очень непросто собрать (мне так и не удалось), а оба они все больше начинают походить на новогоднюю елку, или на пейзаж слона-живописца из басни Михалкова (настоятельно рекомендую к прочтению).
Меня полностью устраивает обновленный truf STP, к которому я прибил гвоздями единственную фичу -- прямоугольные выделения. В нем и работаю...
Такие дела.
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
На Форуме


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5556
Екатеринбург
Пол: male
Re: Модификация ScanTailor
Ответ #362 - 27.01.2018 :: 07:36:30
 
m7876 писал(а) 27.01.2018 :: 06:35:58:
пейзаж слона-живописца из басни

Смех
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
xyz
Гуру
****
Вне Форума


Всем привет!

Сообщений: 895
Re: Модификация ScanTailor
Ответ #363 - 27.01.2018 :: 08:38:57
 
Цитата:
пейзаж слона-живописца из басни Михалкова


Категорически не согласен. Я просто не могу нарадоваться как (ну, за исключением пары мелочей) работает STU. Даже написать хвалебный пост об этом чуть раньше хотел Улыбка Отключил не нужный функционал - и работаю как на конвейере. Ничего лишнего, всё по делу. (нестандартные размеры файлов жрёт, кривые png жрёт, джипеговые tiff жрёт, рамки ставит, эпплай кат делает,  "каждую вторую до конца" делает, порядковые номера страниц показывает, исходник по пробелу показывает; диапазон бинаризации расширен - впервые тут порог 50 применял; даже слой грей пару раз использовал; при выключенном сглаживании не слипаются засечки;  не надо ради  отдельных операций держать зоопарк STF+STE...)

STA я тоже пока так и не запускал.

Что касается "мелочей", то самое главное №1, что при обрезании обложек "без полей" он даёт разброс 1-2 пикселя вместо выравнивания под единый размер. Приходится для этой операции обычный СканТейлор держать и использовать.

Остальное скорее баги и фичи, которые обсуждались ранее:

2) для обложек серии НВЖНТ ярко проявилась необходимость отключения выравнивания освещения для инвертированных ч+б сканов;

3) меня невероятно запутывает терминология фореграунд и пикчер лейер. Каждый раз, когда пользую, по сути по новой разбираюсь, как что работает. Для слоя грей вообще хочется рамку, чтобы не сто раз тыкнул (что-то включил. что-то выключил что-то удалил), а обвел рамку и цвета внутри неё по черно-белой маске проявились.
(я и предлагал его назвать как какую-нибудь вариацию от термина "на просвет", а не создавать путаницу с другими программами).

4) Снова проявилась потеря места страницы. Отсортировал по высоте на стадии поля. Если я правлю сами поля, то я могу перейти на следующую, когда страница убежала. Но если я переключался на стадию "полезная область" и двигал там рамку, то при возврате на стадию "поля" я уже нахожусь на новом исправленном месте и перейти на следующую, там, где был при сортировке ранее, не получается.


Никак я табличку не обновлю, что сделано, что нет...


Цитата:
Да вроде нет. 1 бит получается. Может дело не в деварпинге? Какая у вас Tiff компрессия стоит, LZW?
Можете удалить из этого проекта все страницы, кроме одной глючной, затем сохранить его как новый проект и сбросить мне его файл, исходную страницу и страницу-результат?


Извините за задержку, проект за это время успел попасть в корзину.
Я не понял что значит "удалить и сохранить", я просто собрал в папку файл проекта (на 170 страниц), два исходника и результат.   

http://dropmefiles.com/HIxlN

Обратите внимание, там левые половинки результатов  2 бит, а правые 24 бит.

(Однако после того, как запустил сейчас после восстановления удаленных файлов проект по новой, STU считает, что все файлы в нём необработаны и заменяет 24 бит на 2 бит. Но я прекрасно помню, как в списке файлов при просмотре ACDSee среди кучи ч/б страниц, после того как я поправил искажение появилось две псевдо-цветных. Точно! В сохраненном проекте деварпинг отключен. А как только начинаю править искажение - расставляя и тягая красные точки, файлы снова становятся 24 бит.)


А ещё вот страничка из нового проекта, на которой STU  с ошибкой  вываливается:

http://rgho.st/private/8BYVvKhNh/7f2bf71243897c59b1d012026665b676

Update:
И еще один проект в STU крашится, хотя через ST пролезает
http://rgho.st/private/8WzDNyWr4/d0850a3bbac6190cd042dc84e33dbb51
Наверх
« Последняя редакция: 27.01.2018 :: 17:39:02 от xyz »  
 
IP записан
 
xyz
Гуру
****
Вне Форума


Всем привет!

Сообщений: 895
Re: Модификация ScanTailor
Ответ #364 - 28.01.2018 :: 00:42:34
 

m7876

Цитата:
оба они все больше начинают походить на новогоднюю елку...
к STP я прибил гвоздями единственную фичу -- прямоугольные выделения. В нем и работаю.



У меня возникла следующая мысль.
Все дополнительные фичи STU можно отключить и работать в максимально простой и удобной лично для каждого версии.

Раз у вас есть ощущение "ёлки" и вы вернулись к STP, то значит просто что-то такое вам не нужное не изымается с панелей. Или, возможно, где-то не работает переключение старый/новый интерфейс,
раз у вас не получилось простой комбинацией галочек заставить  STU выглядеть и работать как STP+прямоугольники.

Какой ненужный функционал болтается ?
Где не хватает переключений интерфейса ?
Наверх
 
 
IP записан
 
truf
Активист
***
Вне Форума



Сообщений: 254
Re: Модификация ScanTailor
Ответ #365 - 28.01.2018 :: 17:51:12
 
xyz писал(а) 27.01.2018 :: 08:38:57:
Обратите внимание, там левые половинки результатов  2 бит, а правые 24 бит.


Это эффект из ST FT. Там добавили фичу marginal dewarping. И в рамках нее всем видам dewarping'а сделали еще один deskew на финальной стадии. Т.е. уже после dewarping'а на результат натравливается автоматика, выполняющая deskew (т.к. dewarping может перекосить или подправить ориентацию текста). Автоматика сообщает угол, на который нужно довернуть изображение после dewarp'а, и уровень своей уверенности в этом. Если уровень достаточно высок - deskew применяется.  И вот в этом случае у бинарных изображений сбивается формат на 8bit.
Я исправлю этот эффект путем принудительной конвертации бинарных изображений, подвергшихся последнему deskew, обратно в бинарный формат.

xyz писал(а) 27.01.2018 :: 08:38:57:
А ещё вот страничка из нового проекта, на которой STU  с ошибкой  вываливается:

Update:
И еще один проект в STU крашится, хотя через ST пролезает


Оба падали в моем коде, вырезающим кусок оригинального изображения для отображения по зажатому пробелу. Второй случай выявил проблему со всеми ч.б. изображениями в однобитной кодировке. А первый случай - из-за установленной зоны контента превышающей размер оригинального изображения.
Оба поправил.

Теперь, придется пересобирать Win дистрибутив.
Наверх
 
 
IP записан
 
xyz
Гуру
****
Вне Форума


Всем привет!

Сообщений: 895
Re: Модификация ScanTailor
Ответ #366 - 28.01.2018 :: 19:23:35
 
Цитата:
Теперь, придется пересобирать Win дистрибутив.


Если можно, перед сборкой нового вин-дистрибутива поправьте также "гуляние" размеров страниц при выводе "без полей". Оно порождено вашей правкой ошибки вылета при выводе, и в ST не возникает.  (Там, действительно, возможно падение, но происходит оно крайне редко. А вот дельта обложек без полей в STU является правилом.) Мне почему-то кажется, что в STA при импорте фич STU это собирались учесть и  поправить. Но не знаю, сделали ли.

И еще одна раздражающая мелкая мелочь. Писал, кстати, уже про неё. ST сразу раскрывается на весь экран. По окошку же STU при открытии мне для этого приходится делать даже не один, а целых два клика.
Наверх
 
 
IP записан
 
m7876
Постоялец
**
Вне Форума



Сообщений: 104
Re: Модификация ScanTailor
Ответ #367 - 28.01.2018 :: 23:48:11
 
xyz писал(а) 28.01.2018 :: 00:42:34:
m7876
Раз у вас есть ощущение "ёлки" и вы вернулись к STP, то значит просто что-то такое вам не нужное не изымается с панелей. Или, возможно, где-то не работает переключение старый/новый интерфейс,
раз у вас не получилось простой комбинацией галочек заставить  STU выглядеть и работать как STP+прямоугольники.
Какой ненужный функционал болтается ?
Где не хватает переключений интерфейса ? 

Спасибо. Я подумаю. Возможно, это просто свойственные мне одновременно минимализм и консервативность. Но ощущение "слонопейзажа" меня не оставляет.
Наверх
 
 
IP записан
 
xyz
Гуру
****
Вне Форума


Всем привет!

Сообщений: 895
Re: Модификация ScanTailor
Ответ #368 - 30.01.2018 :: 11:01:53
 
Запишу тут очередную хотелку на будущее, просто чтобы не забыть:

- сортировки на стадии вывод по типу прижима и по высоте.
(тип цветности часто совпадает коррелирует с оформлением макета/размером страницы)
Наверх
 
 
IP записан
 
truf
Активист
***
Вне Форума



Сообщений: 254
Re: Модификация ScanTailor
Ответ #369 - 30.01.2018 :: 23:06:31
 
Я обновил дистрибутивы.
https://github.com/trufanov-nok/scantailor/releases

2 падения - исправлены.
Кол-во цветов в бинарных результатах при dewarp'е исправлено.
+ я улучшил точность наложения оригинального скана при удерживаемом пробеле на этапе output - она сильно люфтила на правых страницах при сильном deskew. (по-дефолту эта фича, вроде, выключена).

Что касается лишних пикселей по краям страниц - изменил логику работы. Теперь STU скорее срежет пару пикселей, чем дорисует.

Ну и go to page num, select pages by their numbers в контекстном меню ленты страниц.
Наверх
 
 
IP записан
 
truf
Активист
***
Вне Форума



Сообщений: 254
Re: Модификация ScanTailor
Ответ #370 - 06.02.2018 :: 20:23:23
 
В dev ветку (пока) я добавил изменение в подсветке выбранных страниц в ленте thumbnail. Теперь при выборе нескольких страниц та, что отображается в данный момент, подсвечивается в ленте синим (как раньше), а остальные выбранные страницы - светло-синим. (На самом деле, используются цвета Highlighted из настроек ОС и он же, но на 25% светлее - так что у вас оно может быть и не сине-голубым). Сделано для того, чтобы легче визуально видеть, где именно в ленте страница, над который идет работа. А то при нескольких выбранных страницах оно все сливается.
Скриншот: http://i99.fastpic.ru/big/2018/0206/5e/82802f0c1cda227475e65727ff92b65e.png
Еще добавлены hotkeys (Alt+[Home/End/PgUp/PgDwn) для навигации внутри множества выбранных страниц. Т.е. можно выбрать диапазон страниц, поменять сортировку - страницы разлетятся по ленте, а потом переключатся меду ними с помощь клавиш навигации с зажатым Alt.

Но вообще, хочу поделится ближайшими планами. Хочу переделать диалог Apply To.
Во-первых, их аж 6 разных. Все они содержат список Apply To ( он же Scope) с вариантами "To selected pages", "To All pages", "To following pages" и пр. А некоторые и состоят практически полностью из этого списка. При этом варианты в списках плавают. Где-то что-то есть, где-то чего-то нет. Где-то как-то иначе названо. Я это унифицирую, выделив все в единый компонент, который будет встраиваться в эти диалоги.

Главное - во-вторых. Я хочу избавится от кнопок apply to. На каждом этапе будет только одна такая кнопка. В диалоги будет добавлен динамически создаваемый перечень настроек текущей страницы на данном этапе. И в нем можно будет включать и выключать те настройки, которые ST будет применять к выбранным страницам.
Т.е. пользователь будет выбирать не только на какие страницы скопировать текущие настройки (как сейчас), но и выбирать, какие именно настойки копировать. И все это в одном окне диалога, вызываемым одной кнопкой. Настройки будут отображаться, конечно, только те, которые меняются текущей стадией обработки.

Такой подход позволит достичь максимальной гибкости. Например - поменять всем страницам Margin Bottom не трогая их текущий Top/Left/Right и пр. Также UI будет более консистентным. А главное - можно заменить все ссылки apply to на одну кнопку в одном месте в каждой панели настроек.
Наверх
 
 
IP записан
 
xyz
Гуру
****
Вне Форума


Всем привет!

Сообщений: 895
Re: Модификация ScanTailor
Ответ #371 - 27.02.2018 :: 10:42:34
 
По-видимому, я обнаружил баг самого скантейлора (версия 9.11.1).

В своём ролике на отметке 6.40   

https://vimeo.com/13985735

Тулон показывает, что параметр деварпинга Depth perception влияет на частоту сетки деварпинга, чтобы компенсировать загиб у корешка. Сетка действительно изменяется. (Видно, как она растягивается/сжимается при движении ползунка). Но при этом никакого влияния на Оутпут не оказывается !

Т.е. я меняю этот параметр, а перерасчет выходного изображения не происходит. Что странно, т.к. измененная сетка вообще-то является основанием коррекции.

Далее. В STU этого нет, но в оригинальном СТ есть.  После деварпинга АВТО, этот ползунок стоит в средней позиции, но вместо соответствующего этому положению значения 2, индицируется значение 1. Может это всё баг одной природы ?
Наверх
 
 
IP записан
 
truf
Активист
***
Вне Форума



Сообщений: 254
Re: Модификация ScanTailor
Ответ #372 - 27.02.2018 :: 20:18:21
 
xyz писал(а) 27.02.2018 :: 10:42:34:
По-видимому, я обнаружил баг самого скантейлора (версия 9.11.1).

В своём ролике на отметке 6.40   

https://vimeo.com/13985735

Тулон показывает, что параметр деварпинга Depth perception влияет на частоту сетки деварпинга, чтобы компенсировать загиб у корешка. Сетка действительно изменяется. (Видно, как она растягивается/сжимается при движении ползунка). Но при этом никакого влияния на Оутпут не оказывается !

Т.е. я меняю этот параметр, а перерасчет выходного изображения не происходит. Что странно, т.к. измененная сетка вообще-то является основанием коррекции.

Далее. В STU этого нет, но в оригинальном СТ есть.  После деварпинга АВТО, этот ползунок стоит в средней позиции, но вместо соответствующего этому положению значения 2, индицируется значение 1. Может это всё баг одной природы ?


Ну, насколько я понимаю, Тулон в начале 2011 отключил сохранение изменений Depth perception тут и не включил в каком-либо другом месте. Может забыл, может специально. Я исправил - и теперь эффект от depth perception наблюдаю.

Похоже, что глубина действительно определяет длину распрямленных строк. Видимо, наложенной сеточки недостаточно для точного определения длины строки непосредственно в месте искривления. Наверное, эту информацию можно было бы получить исходя из того, насколько там уменьшились/увеличились буквы.. Но такого функционала в ST нет, его реализация слишком сложна и на практике работало бы это через раз. Поэтому в случае чего есть коэффициент depth perception.

Вот только эффект от него, судя по всему, выражается не в изменении ширины текста, как можно было бы ожидать, а в сжатии/растягивании страницы по вертикали. Это можно представить как измененный по ширине лист заново смасштабировали, чтобы впихнуть в старый размер страницы с условием, что влево/вправо он выходить не может, а сверху - да. Вот соответствующий коммент в коде:

     // We not only uncurl the lines, but also stretch them in curved areas.
     // Because we don't want to reach out of the content box, we shrink
     // the model domain vertically, rather than stretching it horizontally.

тут.

Я включу его в сл тестовой сборке - попробуйте.
Наверх
 
 
IP записан
 
xyz
Гуру
****
Вне Форума


Всем привет!

Сообщений: 895
Re: Модификация ScanTailor
Ответ #373 - 28.02.2018 :: 08:44:37
 
Цитата:
Вот только эффект от него, судя по всему, выражается не в изменении ширины текста, как можно было бы ожидать, а в сжатии/растягивании страницы по вертикали. Это можно представить как измененный по ширине лист заново смасштабировали, чтобы впихнуть в старый размер страницы с условием, что влево/вправо он выходить не может, а сверху - да.


Когда у нас загнутый корешок расправляется, как раз увеличивается ширина, и это правильно. Главное, чтобы она за размеры страницы (а не зоны контента) не вылезла. Вертикальный же размер должен остаться постоянным. Ну вот представим. Все страницы хорошие, одна загнутая. Она должна разогнуться и стать вровень с остальными, а не при недостаточной ширине подрасти. Тут Тулон не прав, либо точил уже тогда алгоритм не под сканы книг, а под фотографии.

Я думаю, что надо в опциях деварпинга предусмотреть галочку: делать масштабирование по-тулоновски (держать горизонтальный размер фиксом) или по-книжному (держать вертикальный размер фиксом).

И это уже будет вторая галочка в этих опциях.
Про первую, напоминаю, я вам в личку писал (возможность отключения вертикальной свистелки от monday2000, которая далеко не всегда полезна).
Наверх
 
 
IP записан
 
xyz
Гуру
****
Вне Форума


Всем привет!

Сообщений: 895
Re: Модификация ScanTailor
Ответ #374 - 28.02.2018 :: 12:19:58
 
Покрутил версию Experimental.

Там от параметра Depth страница ширеет.
Наверх
 
 
IP записан
 
truf
Активист
***
Вне Форума



Сообщений: 254
Re: Модификация ScanTailor
Ответ #375 - 28.02.2018 :: 18:48:44
 
xyz писал(а) 28.02.2018 :: 12:19:58:
Покрутил версию Experimental.

Там от параметра Depth страница ширеет.


Я собрал текущий experimental и погонял его. Там dewarp объединен с этапом deskew. И от того еще есть техническая возможность изменить размер страницы без необходимости пересчитывать все остальные (у которых match size with others). Поэтому она и ширеет, и по высоте может размер менять. В общем, как я понял, вместо попытки уместить зону контента после dewarp в размеры старой страницы, меняется сам размер страницы - а потом на последующих этапах на ней уже можно искать контент, отмерять поля и пр. В принципе, логично.

Мне еще нравятся кнопки Distortion type. Я вообще dewarp'ом в ST никогда не пользуюсь, т.к. мне больше нравится dewarp в старой программе Book Restorer 4.2.1. Вот это на него уже больше похоже.
Наверх
 
 
IP записан
 
truf
Активист
***
Вне Форума



Сообщений: 254
Re: Модификация ScanTailor
Ответ #376 - 15.03.2018 :: 12:12:03
 
Добавил русский язык в приложение + поправил пару багов: https://github.com/trufanov-nok/scantailor/releases
Наверх
 
 
IP записан
 
truf
Активист
***
Вне Форума



Сообщений: 254
Re: Модификация ScanTailor
Ответ #377 - 26.03.2018 :: 23:06:19
 
Обновил. Пофикшены некоторые баги.
Наверх
 
 
IP записан
 
zorro04
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 115
Re: Модификация ScanTailor
Ответ #378 - 10.04.2018 :: 16:24:26
 
А куда облако пропало?!
Наверх
 
 
IP записан
 
altruist
Активист
***
Вне Форума


Всем привет!

Сообщений: 309
Russia.Penza
Пол: male
Re: Модификация ScanTailor
Ответ #379 - 10.04.2018 :: 18:46:31
 
zorro04 писал(а) 10.04.2018 :: 16:24:26:
А куда облако пропало?!

Всё на месте, по ссылке  https://github.com/trufanov-nok/scantailor/releases.
Наверх
 

Хорошая вещь компьютер...Посидел пять минут-полтора часа прошло....
 
IP записан
 
truf
Активист
***
Вне Форума



Сообщений: 254
Re: Модификация ScanTailor
Ответ #380 - 17.04.2018 :: 03:40:20
 
zorro04 писал(а) 10.04.2018 :: 16:24:26:
А куда облако пропало?!


Облако я прибил, как только понял, что народ продолжает качать оттуда дистрибутивы. Как только я начал выкладывать релизы на соответствующей страничке проекта в github, я перестал обновлять их в облаке, и вообще, считал, что им пользуемся только я и xyz. Так что там все давно устарело, а то и в тестовом варианте. Брать дистрибутивы нужно исключительно с github'а.
Наверх
 
 
IP записан
 
xyz
Гуру
****
Вне Форума


Всем привет!

Сообщений: 895
Re: Модификация ScanTailor
Ответ #381 - 18.04.2018 :: 08:16:44
 
Происходит странное падение в версии 0.2.2   Win 7

Загружаю три скана. Потом сразу же третий удаляю из проекта. STU падает.
Пробовал в других папках с другими картинками - ситуация воспроизводится.

UPD
и в 0.2.3 так
Наверх
« Последняя редакция: 18.04.2018 :: 08:38:22 от xyz »  
 
IP записан
 
xyz
Гуру
****
Вне Форума


Всем привет!

Сообщений: 895
Re: Модификация ScanTailor
Ответ #382 - 18.04.2018 :: 11:34:12
 
Цитата:
-  в экспорте STU, действительно, имеется баг.  (Я его дважды репортил, но пока так и не устранили).

-  Вроде уже исправлял, еще в январе. Это фича из STF



Вы правы в том, что ошибку для джвуимаджера, скорее всего, генерировал уже устранённый в STU баг.
Но и я прав. Я имел в виду другую ситуацию. Она не поправлена.

При деварпинге, ч/б буквы искажаются и ложатся в отупут с серыми окантовками на скосах. Эти паразитные окантовки попадают при экспорте и разделении на слой фона.    (И потом собираются и проявляются в файле).
То есть тут нужно где-то промежуточную ребинаризацию делать, либо слой фона очищать там, где картинок нету. 

Проект с примером таких окантовок на первой странице выложил.

http://dropmefiles.com/Vrr9m
Наверх
 
 
IP записан
 
truf
Активист
***
Вне Форума



Сообщений: 254
Re: Модификация ScanTailor
Ответ #383 - 21.04.2018 :: 16:13:53
 
xyz писал(а) 18.04.2018 :: 08:16:44:
Происходит странное падение в версии 0.2.2   Win 7

Загружаю три скана. Потом сразу же третий удаляю из проекта. STU падает.
Пробовал в других папках с другими картинками - ситуация воспроизводится.

UPD
и в 0.2.3 так


Воспроизвел на Win. Исправлю в сл версии.
Наверх
 
 
IP записан
 
xyz
Гуру
****
Вне Форума


Всем привет!

Сообщений: 895
Re: Модификация ScanTailor
Ответ #384 - 26.04.2018 :: 10:38:01
 
Цитата:
Я имел в виду другую ситуацию. Она не поправлена.


Надеюсь тут не так как здесь:

...
Наверх
 
 
IP записан
 
truf
Активист
***
Вне Форума



Сообщений: 254
Re: Модификация ScanTailor
Ответ #385 - 26.04.2018 :: 23:19:30
 
xyz писал(а) 26.04.2018 :: 10:38:01:
Я имел в виду другую ситуацию. Она не поправлена.

Да нет, код вполне хорош, особенно то, что писал сам Tulon. Прост руки пока не доходят.
Наверх
 
 
IP записан
 
truf
Активист
***
Вне Форума



Сообщений: 254
Re: Модификация ScanTailor
Ответ #386 - 27.04.2018 :: 09:39:59
 
Оставлю здесь такое наблюдение. Может кому-то пригодиться, кто нагуглит по коду ошибки.

После экспорта результатов из STU, по методу разделяемых сканов попытался обработать изображения в DjVu Imager 2.9 и получил ошибку: "Ошибка на файле 1.tiff. Поддерживаются только цветные 24-битные и серые 8-битные изображения".

Я уж было решил, что это та же ошибка, что недавно обсуждалась в соседней ветке, но это не она.
Насколько я понял, DjVu Imager идет с кодеком fi_c44.exe (Image compression utility using IW44 wavelets), который описан здесь. Там же автор сообщает, что:
Цитата:
fi_c44 принимает на входе только цветные 24-битные или серые 8-битные изображения (именно такие и подразумевает DjVuPhoto - остальные бессмысленно пытаться закодировать).


Взглянул на 1.tiff - он действительно оказался 32-х битным. Утилита tiffinfo выдала мне
Цитата:
Resolution: 600, 600 pixels/inch
Bits/Sample: 8
Photometric Interpretation: RGB color
Samples/Pixel: 4

При том, что все остальные tiff файлы имели "Samples/Pixel: 3" и были, соответственно, 8*3 = 24-х битными.
Я их получал из сканов, сохраненных в png. Проверил png при помощи утилиты mediainfo, и тот, что отвечал за 1.tiff действительно оказался:
Цитата:
Bit depth                                : 32 bits

А остальные - 24-бит.
Естественно, 1.png - оказался обложкой Улыбка. Обложку я сканировал дважды, т.к. у меня не умещался корешок: обложку с частью корешка и корешок с частью обложки. И оба скана были 24-х битными. После чего из 2-х сканов я собирал полный скан обложки с корешком. Делал это в редакторе GIMP, и в этот момент, каким-то образом, он мне включил "прозрачность", т.е. добавил к RGB еще один 4-й альфа-канал, что и дало 8 бит к 24-м уже имевшимся. Прозрачности там, конечно, никакой не было, а канал для нее - был. Я снова открыл png файл в GIMP, отключил прозрачность в слоях, сохранил его, перегенерировал соответствующий ему tiff - он стал 24-х битным, и DJVU Imager его без проблем обработал.

И вот я думаю, надо ли тут что-либо исправлять...

С одной стороны ST бережно сохранил информацию об альфа-канале исходного png, и протащил ее не только в output, но и через export to.. В целом, это правильно: может я не djvu, а pdf какой-нибудь из этих результатов делать собираюсь. Отрубать его принудительно, будет не комильфо. Может подумать об опциональной настройке для output или только export to..

С другой стороны, пользователь должен бы сам знать, чего он тащит в программу и сколько в этом бит. Но сам же я и обжегся на этом. У всех давно hdd по терабайту и никто не следит за настройками сохранения. Возможно, стоит добавить warning при export to.. для пользователя, что через него проходит 32, а не 24 или 8 бит. Но warning без объяснения, как решить проблему - только выбесит.

К тому же, я пользовался только DJVU Imager (он лет 8 не обновляется), возможно другие кодеки/инструменты давно умеют работать с 32-х битными tiff (скорее всего, просто игнорируют информацию из альфа-канала на лету с warning'ом и всего делов), тогда мои warning'и будут не в тему, а проблема становится проблемой только DJVU Imager'а. Тот же DJVU Small c documenttodjvum.exe на борту на 32-х битные tiff'ы не ругается.
В общем, пока я не определился, нужно ли вообще тут что-то менять.
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
На Форуме


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5556
Екатеринбург
Пол: male
Re: Модификация ScanTailor
Ответ #387 - 27.04.2018 :: 10:33:29
 
truf писал(а) 27.04.2018 :: 09:39:59:
Но warning без объяснения, как решить проблему - только выбесит

можно писать "! в DJVU Imager v2.9 не пройдёт, используйте другие кодеры с МПФ".
И/или модифицировать DJVU Imager.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
xyz
Гуру
****
Вне Форума


Всем привет!

Сообщений: 895
Re: Модификация ScanTailor
Ответ #388 - 27.04.2018 :: 14:07:40
 
Цитата:
И вот я думаю, надо ли тут что-либо исправлять...

С одной стороны ST бережно сохранил информацию об альфа-канале исходного png, и протащил ее не только в output, но и через export to.. В целом, это правильно: может я не djvu, а pdf какой-нибудь из этих результатов делать собираюсь. Отрубать его принудительно, будет не комильфо. Может подумать об опциональной настройке для output или только export to..

С другой стороны, пользователь должен бы сам знать, чего он тащит в программу и сколько в этом бит. Но сам же я и обжегся на этом. У всех давно hdd по терабайту и никто не следит за настройками сохранения. Возможно, стоит добавить warning при export to.. для пользователя, что через него проходит 32, а не 24 или 8 бит. Но warning без объяснения, как решить проблему - только выбесит.

Я где-то читал пояснения тулона, что на выходе - то что на входе. Т.е. если есть альфа-канал, то он будет. Если серый 256 - то будет серый 256. Попробую соорудить про это пункт в FAQ.

По поводу проблемы, я думаю и несколько раз писал, что нужна доработка диалога FixDPI  так, чтобы он демонстрировал таблицу, что мы имеем на входе:

файл; ширина; высота; разрешение; цветность;  число чистых цветов (если есть).

И если где-то расходится с другими файлами или за пределы ST вылезает (50 см лимит размеров страниц) можно варнинги демонстрировать.

Наверх
 
 
IP записан
 
slava_kry
Гуру
****
Вне Форума



Сообщений: 557
Re: Модификация ScanTailor
Ответ #389 - 27.04.2018 :: 21:03:43
 
ИМХО пусть всё остаётся как есть, что на входе, то на выходе.

Могу ещё одно наблюдение подкинуть. Улыбка Я понятия не имею почему так, но "сиё есть факт" Улыбка
Вообщем, я объединяю разделённые сканы в ИнДизайне и заметил такую странность. Если импортировать файлы напрямую из STA, то ИД частенько начинает "подвисать", т.е. работает, но "рывками" очень долго читая случайный файл (внизу есть процесс бар). Перезаписываешь файлы через Шоп,  ничего не меняя (формат, размер, сжатие), всё работает нормально.
Меня это не тревожит, но вдруг что-то выяснится или всплывёт ещё где.
Наверх
 

Он сказал им: вы выказываете себя праведниками пред людьми, но Бог знает сердца ваши, ибо что высоко у людей, то мерзость пред Богом.
 
IP записан
 
Страниц: 1 ... 11 12 13 14 15 ... 18
Послать Тему Печать