OCR форумы Добро пожаловать, Гость. Пожалуйста, выберите Вход или Регистрация
Форум переведен из кодировки UTF-8 в кодировку WINDOWS-1251. По всем вопросам, связанным с кодировкой текста (появлением «кракозябр»), обращайтесь к Администратору.
The forum is translated from the UTF-8 encoding to the WINDOWS-1251 encoding. For all questions related to the encoding of the text (the appearance of 'krakozyabr'), please contact the Administrator.
 
  ГлавнаяСправкаПоискВходРегистрация Администратор Библиотека  
 
Страниц: 1 ... 3 4 5 6 
Послать Тему Печать
Ищется А. Шломан - Иллюстрированный технический словарь на шести языках. (Прочитано 11884 раз)
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 4657
Екатеринбург
Пол: male
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #120 - 28.07.2021 :: 19:12:09
 
niccolo писал(а) 28.07.2021 :: 16:20:40:
если есть русские файлы с этим переводом

ага, гляну.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
niccolo
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 182
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #121 - 28.07.2021 :: 21:42:21
 
Так, наблюдения

CH плохая (сливается) на титульнике немецкого словаря

Над Й черта потерялась в названии русской редакции.

Непорядок для перфекционизма

По поверхностному взгляду на содержание DE и RU версий т 12 - совпадает. Так что можете использовать ваших целей...

Кстати, не подскажете - как импортировать ваши PDF в Сканкромсатор, чтобы и сохранить картиночные  блоки на страницах и количество страниц совпало с реальным (чтобы файлов картинок не было на закладке файлс).

Или как merge external picture zone в исходные файлы, чтобы они стали internal picture zone
Наверх
« Последняя редакция: 28.07.2021 :: 23:06:14 от niccolo »  
 
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 4657
Екатеринбург
Пол: male
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #122 - 29.07.2021 :: 04:45:36
 
поглядел я на абзац вверху страницы XIX. Гугл-переводчик утверждает что там написано "впервые", то есть до 1928 года таких страниц не существовало (можно так понять). Но до предыдущих изданий я ещё не добрался.

""Предметный указатель предназначен для облегчения выбора специального объема, необходимого в каждом отдельном случае, и для предоставления пользователю этого словаря путеводителя по всем специальным томам иллюстрированных технических словарей, которые были опубликованы на данный момент. Предметный указатель, который впервые добавляется в специальный том, призван помочь преодолеть трудности, возникающие из-за разделения технологий на специализированные области; Посмотрев на группы специалистов в этом предметном указателе, легко понять, с какими группами специалистов пользователю этого словаря все же придется проконсультироваться.""

Примерно да, с этой целью файл и нужен. Как АПУ в библиотеке.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
niccolo
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 182
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #123 - 29.07.2021 :: 08:49:23
 
Цитата:
поглядел я на абзац вверху страницы XIX. Гугл-переводчик утверждает что там написано "впервые", то есть до 1928 года таких страниц не существовало (можно так понять). Но до предыдущих изданий я ещё не добрался.


Понял, о чём вы - о Sachregister (предметный указатель) в томе 2....

Честно говоря, когда все 17! (в указателе только 16) томов объединены в один словарь - смысла в нём никакого нет.
Положение (в т 2) тоже как-то особой радости не вызывает.

Но подумаю на досуге.... Пока главная задача - перевести том 17, затем - исправить картинки и удалить дубликаты.
Наверх
 
 
IP записан
 
niccolo
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 182
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #124 - 29.07.2021 :: 20:01:56
 
AAW

как merge external picture zone в исходные файлы, чтобы они стали internal picture zone — не подскажете?

Или может у Вас есть XLS c подписанными в столбцах названиями параметров для экспорта skt файлов, чтобы попытаться вручную перенести координаты зон в другой пакет SK экспорт без выделения внешних картиночных зон.
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 4657
Екатеринбург
Пол: male
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #125 - 30.07.2021 :: 04:07:02
 
нет, не знаю такого.

Может быть, подшаманить сам pdf вначале?
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
bolega
Гуру
****
Вне Форума



Сообщений: 988
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #126 - 30.07.2021 :: 08:18:20
 
niccolo писал(а) 29.07.2021 :: 20:01:56:
AAW

как merge external picture zone в исходные файлы, чтобы они стали internal picture zone — не подскажете?

Или может у Вас есть XLS c подписанными в столбцах названиями параметров для экспорта skt файлов, чтобы попытаться вручную перенести координаты зон в другой пакет SK экспорт без выделения внешних картиночных зон.


Такого нет к сожалению.
Но не очень понятно, чем не угодили внешние зоны. Они уже выделены в отдельные файлы, ну и пусть такими и будут, по крайней мере серые.
Я советую так сделать: после импорта из Pdf нажать большую кнопку внизу "сбросить все опции и отмаркировать все". Запустить задание на обработку. После обработки сделать merge зон, выбрав там только b/w-зоны (!). В итоге получите на выходе сплошную нумерацию файлов, и зоны останутся только gray, ну и пусть будут уже вырезанными. Затем даете команду create out-task и с получившимся заданием уже работаете дальше.
Наверх
 
 
IP записан
 
niccolo
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 182
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #127 - 30.07.2021 :: 09:39:18
 
Цитата:
Но не очень понятно, чем не угодили внешние зоны.


Нумерацией при извлечении из ПДФ/Тем, что не все изображения в книге выделены, а некоторые изображения разбиты.

И исправлять это надо ручками - хотелось бы хотя-бы уменьшить объём ручной работы (втянув координаты уже размеченных зон).....

Но самое похабное, что в глядя на страничку втянутого в SK PDF c зонами и рисуя зону на невыделенном изображении ОКАЗЫВАЕТСЯ, ЧТО ТЫ РИСУЕШЬ В ВОЗДУХЕ. - она не отображается на странице, но сохраняется при обработке пустым белым квадратиком....

Кстати результат обработки страниц - жесть - половина пустых листов (полагаю из-за структуры страницы с картинками в виде бутерброда: пустая подложка - текстовая часть - картинки)

Не совсем понимаю смысл пустой подложки.
Для картинок тоже нужен прозрачный фон - ибо есть места перекрытия картинками текста в SK...
В FR15 вроде файлы и удалось подменить, но сам ФР вываливается с ошибкой....
..........Один головняк с такой простой задачей......

Попробуйте для интереса втянуть в SK том 12 с внешними imagе-зонами - невозможно работать с пакетом. Может донесёте до болеги баги именно этого импорта и его представления в программе.

Нумерация рисунков до/после обработки с привязкой к странице, как вариант, может быть лучшей альтернативой нынешней сплошной нумерации. При импорте PDF ЭТО ЗАМЕТНО СРАЗУ.
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 4657
Екатеринбург
Пол: male
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #128 - 30.07.2021 :: 11:43:53
 
niccolo писал(а) 30.07.2021 :: 09:39:18:
что не все изображения в книге выделены, а некоторые изображения разбиты

ну может хоть вас manjak1961 да услышит. А то его кодирование с автосегментацией задолбало.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
bolega
Гуру
****
Вне Форума



Сообщений: 988
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #129 - 30.07.2021 :: 12:16:31
 
niccolo писал(а) 30.07.2021 :: 09:39:18:
Но самое похабное, что в глядя на страничку втянутого в SK PDF c зонами и рисуя зону на невыделенном изображении ОКАЗЫВАЕТСЯ, ЧТО ТЫ РИСУЕШЬ В ВОЗДУХЕ. - она не отображается на странице, но сохраняется при обработке пустым белым квадратиком....


Я уже сказал как поступить, обработать и слить. Можно все зоны. Тогда никаких пустых страничек не будет.
Вы наверно, ни фига   не представляете себе внутреннее устройство PDF. Думаете, СК просто так такую иерархию страниц/зон создает?  Что есть внутри pdf, то он и воссоздает. Нет тут никаких багов, так и задумано. Такой импорт предназначен для людей, которые хотят по максимуму выжать из pdf. Если хочется не как лучше, а как попроще, пожалуйста: средствами акробат экспортируете странички в jpg/tif/... и никаких проблем.
Наверх
 
 
IP записан
 
xyz
Гуру
****
Вне Форума


Всем привет!

Сообщений: 716
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #130 - 30.07.2021 :: 14:00:37
 
Если я правильно понял, проблема в том, что часть зон не выделена, оставлена в ч.б. слое.

А почему бы не попробовать сделать так.

После импорта файла задействовать команду  Create separate bw files for non bw-zones.
получите комплект задников и передников.

Потом отдельно по передникам можно новые зоны выделить.   

(Если нужно их отправить в задники, то, видимо, придется уже получать два комплекта задников, а потом сливать их друг с другом.
А если нужны координаты зон, то труф же встроил в STU  и генерацию масок, и экспорт координат. Запихнуть в них задники и снять координаты. )



Наверх
 
 
IP записан
 
niccolo
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 182
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #131 - 30.07.2021 :: 15:37:51
 
Цитата:
Если я правильно понял, проблема в том, что часть зон не выделена, оставлена в ч.б. слое.


Не только. Проблема еще и в нарушении порядка зон по вашему методу.

Если на странице 6 рисунков - выделено 3 серых и не выделено 3 ч/б - проверяя пакет я бы мог исправить порядок зон. В вашем варианте — это гораздо более трудоёмко.

Цитата:
А если нужны координаты зон


Они есть в skt - вопрос в том, как их из внешних преобразовать во внутренние.

Ладно - буду думать
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 4657
Екатеринбург
Пол: male
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #132 - 30.07.2021 :: 15:57:52
 
niccolo писал(а) 30.07.2021 :: 15:37:51:
в нарушении порядка зон

z-порядка? или какого? Я слабо понимаю - как вообще кускам страницы можно дать обоснованный порядок. Координаты экрана и то произвольно устанавливают в каком углу (0,0). А тут простая простыня, как хошь так и крути.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
xyz
Гуру
****
Вне Форума


Всем привет!

Сообщений: 716
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #133 - 30.07.2021 :: 16:04:28
 
Кажется, я понял, в чем проблема.
А попробуйте импорт в sk 6.00.5  сделать, потом нажать четвертую маркировочную кнопку ("сбросить опции и отмаркировать файлы"), а потом кнопку процесс. 

У меня в нём другие результаты в выходной папке получаются.
Я даже и не посмотрел, что 6.71  тут по сравнению с привычным мне поведением мудрит.
Наверх
 
 
IP записан
 
niccolo
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 182
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #134 - 30.07.2021 :: 16:42:13
 
Цитата:
z-порядка? или какого? Я слабо понимаю - как вообще кускам страницы можно дать обоснованный порядок. Координаты экрана и то произвольно устанавливают в каком углу (0,0). А тут простая простыня, как хошь так и крути.


Простого порядка - порядка следования на странице. Поскольку в данном случае картиночки располагаются сверху вниз - то в порядке их расположения сверху вниз....

т.е. самая верхняя 1, чуть ниже 2 и т.п.

вот ролик ерунды в 6.71 с этими файлами - выделяю зону, хочу сделать её картинкой - получаю кукиш.
Пустые белые странички превью рядом тоже очень забавны....

https://www.upload.ee/files/13353626/Video_2021-07-30_163311.wmv.html
Наверх
 
 
IP записан
 
niccolo
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 182
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #135 - 30.07.2021 :: 16:57:14
 
Цитата:
А попробуйте импорт в sk 6.00.5  сделать, потом нажать четвертую маркировочную кнопку ("сбросить опции и отмаркировать файлы"), а потом кнопку процесс.


Попробовал - получил странички без картинок и картинки. То же самое и на входе - просто картинки обозваны тиффами с номерами, как и текстовые страницы. Это я и простым экспортом картинок из ПДФА получить мог.....

Мне нужен пакет SK c отмаркированными на страничках картиночными зонами, причём зоны должны строго идти в порядке сверху вниз и в том же порядке нумероваться на выходе....
Наверх
 
 
IP записан
 
xyz
Гуру
****
Вне Форума


Всем привет!

Сообщений: 716
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #136 - 30.07.2021 :: 17:28:02
 
Вы получили "пакет SK c отмаркированными на страничках картиночными зонами".
(Чего в 6.71 после процессинга не получилось, всё слилось. )


А нужно поставить новую зону - вышли из окна RV, добавили свою дополнительную и переобработали файл. Вот вам и новая зона.


Что же касается нумерации - ну не рассчитан СК на то, чтобы его вывод в ФР запихивался.
Хотя в папке куда был сделан импорт, имена файлов зон имеют вид "номер страницы_номер зоны на странице". Только расположены не по порядку зон. Но отследить глазами можно.
И при этом нет паразитных пустышек.
Наверх
 
 
IP записан
 
xyz
Гуру
****
Вне Форума


Всем привет!

Сообщений: 716
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #137 - 30.07.2021 :: 17:32:12
 
Наверное можно болега попросить, чтобы при изготовлении оут-файла можно было сделать ренумерацию зон по порядку
(порядку координат их левых верхних углов).
Наверх
 
 
IP записан
 
niccolo
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 182
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #138 - 30.07.2021 :: 17:47:02
 
Цитата:
Вы получили "пакет SK c отмаркированными на страничках картиночными зонами".
(Чего в 6.71 после процессинга не получилось, всё слилось. )


Не знаю, почему у вас всё слилось - у меня это всё получалось сразу вкупе с пустышками подложками....

Цитата:
Что же касается нумерации - ну не рассчитан СК на то, чтобы его вывод в ФР запихивался.

Я это знаю. Просто в какой-то версии точно помню, картинки нумеровались отдельно по каждой странице...
Если бы все зоны были одинаковые - этого наверное можно было бы как-то добиться. Но с разными зонами вряд ли....


Ладно, спасибо за внимание и советы... Видимо снова придётся через долбанный ФР.
Наверх
 
 
IP записан
 
xyz
Гуру
****
Вне Форума


Всем привет!

Сообщений: 716
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #139 - 30.07.2021 :: 17:51:02
 
Цитата:
Не знаю, почему у вас всё слилось - у меня это всё получалось сразу вкупе с пустышками подложками....


вы вот эти действия совершали ?

"нажать четвертую маркировочную кнопку ("сбросить опции и отмаркировать файлы"), а потом кнопку процесс."


Если "сразу". То, да, с пустышками. А потом уже нет.
Наверх
 
 
IP записан
 
bolega
Гуру
****
Вне Форума



Сообщений: 988
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #140 - 30.07.2021 :: 18:39:09
 
Само ничего не сольется с пустышками. Ключевое слово: дать команду merge после обработки. После обработки, Карл, не просто после импорта Улыбка

Пустые страницы после импорта в последних версиях будут если:
1) в окне импорта включена галка на use original pdf size. В прошлых версиях такой опции не было. Из-за этого после импорта размеры страниц могли не совпадать с тем, что было в pdf. Чуть ниже объясню почему.
2) Даже если галка отключена, пустышки (подложки) появляются, если размер страницы pdf не совпадает с областью, занимаемой всей совокупностью изображений, расположенных над ней.

Чтобы было понятно как pdf хранит страницы: для каждой страницы создается канва определенного размера (в дюймах или мм, не важно, но не в пикселях). Поверх этой канвы pdf располагает (рисует) разные изображения или объекты. Порядок расположения может быть абсолютно произвольным. Может сначала идти ч/б изображение 600dpi с текстом, а сверху картинки. Может быть и совсем наоборот (как в djvu): сначала например 300dpi слой с картинками, а поверх слой текста (с прозрачностью на месте фона).
Так вот, если картинки полностью покрывают размер канвы, то СК не будет создавать пустышку, он оптимизирует страницу, превращая самую большую ч/б составляющую в основную страницу (и то при условии, что в z-порядке она самая нижняя). Если же размеры не совпадают  (бывают что очень сильно, но для СК достаточно и доли мм), или z-порядок сильно перемешан (т.е. смесь слоев со сложными масками прозрачности), то СК как бы создает аналог пустой канвы, а поверху помещает зонами все остальное (т.е. в точности как в pdf). И уже пользователю решать, что с этим делать, раз уж создатель pdf зачем-то так сделал. Обычно это делается, чтобы обеспечить наличие белых полей, которых нет например на самом изображении.
Надеюсь, понятно объяснил.

В прежних версиях СК не соблюдал размер канвы pdf-страниц, поэтому результат импорта мог сильно отличаться в части размеров страниц от того, что наблюдалось при просмотре pdf. На этот счет я получал жалобы от пользователей. Сейчас я это исправил, но теперь и пользователю придется напрячь мозги, чтобы решать что с этим делать.

Наверх
« Последняя редакция: 30.07.2021 :: 19:11:10 от bolega »  
 
IP записан
 
xyz
Гуру
****
Вне Форума


Всем привет!

Сообщений: 716
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #141 - 30.07.2021 :: 18:48:23
 
Мне это в принципе понятно.

Я не могу говорить за то, что делал niccolo, могу за себя.

Я не трогая никакие дефолтные настройки и в 6.00.5, и в 6.71 сделал три действия:

1) импортировал pdf
2) нажал маркировочную кнопку
3) запустил process

и получил разные результаты.
Если в 6.00.5    в папке Tempsk\словарь\out      зоны шли отдельными файлами

то в 6.71 в папке Tempsk\словарь\out   
никаких зон вообще не было.   (Видимо, они подтягивались непосредственно из папки импорта).


Как результат, в 6.00.5. я могу руками новую зону, там где был импорт, воткнуть, а в 6.71 нет.
Зона просто не ставится.
Наверх
 
 
IP записан
 
xyz
Гуру
****
Вне Форума


Всем привет!

Сообщений: 716
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #142 - 30.07.2021 :: 18:52:01
 
UPD
Про сливание я ошибся.
Я по пустышке кликал, вот зона и не выделялась, а я подумал, что слилась.
Наверх
 
 
IP записан
 
bolega
Гуру
****
Вне Форума



Сообщений: 988
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #143 - 30.07.2021 :: 19:00:56
 
Я понял, о чем вы.

xyz писал(а) 30.07.2021 :: 18:48:23:
и получил разные результаты.
Если в 6.00.5    в папке Tempsk\словарь\out      зоны шли отдельными файлами
то в 6.71 в папке Tempsk\словарь\out   
никаких зон вообще не было.   (Видимо, они подтягивались непосредственно из папки импорта).

Да, нет смысла создавать в out копии зон, если для них не включено ни одной опции обработки.

В версии 6.71 такие копии все-таки создать можно, но для этого в свойствах зоны нужно включить новую опцию create out file. Достаточно задать ее в одной зоне, и скопировать опцию на все опции задания. Тогда при обработке в out будет создаваться выходной файл для зоны, даже если ничего в зоне не менялось.

А для merge абсолютно не имеет значения, были ли созданы в Out копии внешних зон, или нет. Он отработает как надо.
Наверх
 
 
IP записан
 
niccolo
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 182
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #144 - 30.07.2021 :: 19:47:16
 
bolega

А вы не посоветуете чего? Или всё ручками по новой?
Наверх
 
 
IP записан
 
xyz
Гуру
****
Вне Форума


Всем привет!

Сообщений: 716
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #145 - 31.07.2021 :: 07:10:51
 
bolega
Про новую опцию любопытно, конечно.
Но хотелось бы получить комментарий ко второй части моего поста:

Цитата:
Как результат, в 6.00.5. я могу руками новую зону, там где был импорт, воткнуть, а в 6.71 нет.
Зона просто не ставится.


Почему в 6.00.5 я могу в дополнение к импортированным расставить пользовательские зоны
(и потом в папке out получить и их, и очищенные от них текстовые страницы),
а в 6.71 не могу ?
Наверх
 
 
IP записан
 
bolega
Гуру
****
Вне Форума



Сообщений: 988
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #146 - 31.07.2021 :: 07:51:40
 
xyz писал(а) 31.07.2021 :: 07:10:51:
bolega
Почему в 6.00.5 я могу в дополнение к импортированным расставить пользовательские зоны
(и потом в папке out получить и их, и очищенные от них текстовые страницы),
а в 6.71 не могу ?

Можете конечно, расставить, но в новой версии текстовые страницы получаются пустышками, и соответственно зоны тоже будут пустыми. Внутренние зоны не затрагивают внешние (у меня кстати в todo есть пункт о слиянии внешних зон на лету, до применения внутренних зон, но это очень далекая хотелка).

Попробуйте импортировать в 6.71 с отключенной use original pdf size. Увидите, что большинство страниц получится без лишних пустышек (вам же так надо?), а пустышки сгенерируются там, где ширина текстовой зоны (2351pix) больше ширины канвы (2350pix) всего на оди pix (в пересчете на 600dpi). Почему так, я не знаю, возможно СК или PDF-XChange Editor где-то точность потерял при округлении.
Наверх
 
 
IP записан
 
bolega
Гуру
****
Вне Форума



Сообщений: 988
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #147 - 31.07.2021 :: 07:54:57
 
niccolo писал(а) 30.07.2021 :: 19:47:16:
bolega

А вы не посоветуете чего? Или всё ручками по новой?

Сейчас такого функционала нет. Мне бы такое никогда и в голову бы не пришло: сливать зоны, чтобы снова их расставлять (и я так и не понял  почему так все сложно, почему серые зоны нельзя оставить "снаружи", это же картинки, на ocr не влияют).
Наверх
 
 
IP записан
 
xyz
Гуру
****
Вне Форума


Всем привет!

Сообщений: 716
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #148 - 31.07.2021 :: 08:14:26
 
Цитата:
вам же так надо?

Мне тут вообще не надо никак.
Просто странно, что в 6.71 невозможно сделать то, что делалось в 6.00.5 и если что-то разломалось, то почему через опции нельзя вернуть нормальное поведение.

В данном случае, в отличие от никколо, меня беспокоит не нумерация и не пустышки.
А то, что в оригинале часть картинок в зоны не попали. В 6.00.5 я их после импорта выделяю и получаю потом (после процесинга) в зонах.
Далее я могу их раскрашивать, подменять и т.д.,  и т.п.
Но фиг это сделаешь в 6.71.
Наверх
 
 
IP записан
 
niccolo
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 182
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #149 - 31.07.2021 :: 10:19:58
 
Цитата:
и я так и не понял  почему так все сложно, почему серые зоны нельзя оставить "снаружи", это же картинки, на ocr не влияют


1. Можно оставить.
2. Почему сложно - серые зоны расположены не по порядку. По первым проверенным 200 изображениям порядка 1/3 зон расположены не по порядку (нижние картинки идут первыми). Кроме того, не размечено порядка 5% картинок....

Ну а теперь вопрос на засыпку - как легче проверять яйца - в старом советском лотке на 30 штук или в полиэтиленовом пакетике?

Так и тут - если бы зоны в книге были все размечены - просто листаешь, доразмечаешь неразмеченные и исправляешь  порядок - просто меняешь местами яйца в лотке и понимаешь, что всё по порядку. Типичная такая работа для файнридера. Я думаю, если в текстовой книге абзац снизу страницы вдруг окажется выше абзаца вверху страницы - ненормальность этого ни у кого не вызовет вопросов....

А так - надо смотреть наружные картинки, сравнивать соответствие их порядка с эталонными и исправлять нумерацию, довыделять, обрабатывать и докопировать отсутствующие картинки.... (Читай держать на экране 4 окна - 2 просмотрщика, проводник/тотал, SK)

Какой подход проще?

И вопрос про структуру SPT остаётся.
Наверх
 
 
IP записан
 
Страниц: 1 ... 3 4 5 6 
Послать Тему Печать