OCR форумы Добро пожаловать, Гость. Пожалуйста, выберите Вход или Регистрация
Всем привет!
Hi all!
 
  ГлавнаяСправкаПоискВходРегистрация Администратор Библиотека  
 
Страниц: 1 2 3 4 5 6 
Послать Тему Печать
Ищется А. Шломан - Иллюстрированный технический словарь на шести языках. (Прочитано 46355 раз)
AAW
Патриарх
*****
На Форуме


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5569
Екатеринбург
Пол: male
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #90 - 28.03.2021 :: 09:11:16
 
niccolo писал(а) 27.03.2021 :: 20:33:09:
введение пронумеровано отдельно

Вот я и не пойму толком ваше пожелание.
имеем в оригинале (придуманный пример):
обложка
форзац (2шт)
введение от I до XII
текст от 1 до 726
нахзац (2 шт)
обложка

Что куда вы просите переместить?

С DEEPro - ответ был понятен?
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
AAW
Патриарх
*****
На Форуме


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5569
Екатеринбург
Пол: male
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #91 - 28.03.2021 :: 10:44:15
 
bolega писал(а) 28.03.2021 :: 09:32:27:
А DEEpro перестраивает гиперссылки при манипуляции страницами?

не проверял.
Думаю, что инженеры об этом подумали (сорри, тавтология), операции-то базовые, а писали софт тогда, когда еще думать умели комплексно.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
niccolo
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 185
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #92 - 28.03.2021 :: 11:37:38
 
Цитата:
Вот я и не пойму толком ваше пожелание.
имеем в оригинале (придуманный пример):
обложка
форзац (2шт)
введение от I до XII
текст от 1 до 726
нахзац (2 шт)
обложка

Что куда вы просите переместить?


Имеем в файле - все страницы пронумерованы насквозь
обложка - 1 стр
форзац - 2-3 стр
введение от I до XII - 4-15 стр
текст от 1 до 726 — 16 и т.д.
нахзац (2 шт)
обложка

При проверке ошибок или при работе с алфавитным указателем для каждого тома придётся либо запоминать длину введения и соответствующим образом в уме корректировать переходы на правильную страницу, либо постоянно листать.
Возможно - сдвиг страниц можно подкорректировать в Суматре, но я не нашёл такой функции.

Надо что-бы было так

обложка + форзац + введение от I до XII - стр I-XV или a,b,c,d,e etc.
текст и указатель — с 1 и т.д. (исключая т.1)
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
На Форуме


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5569
Екатеринбург
Пол: male
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #93 - 28.03.2021 :: 12:00:51
 
niccolo писал(а) 28.03.2021 :: 11:37:38:
текст и указатель — с 1 и т.д.

ну а если посреди текста затешется вкладка?
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
niccolo
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 185
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #94 - 28.03.2021 :: 13:14:25
 
Цитата:
ну а если посреди текста затешется вкладка?


В данном случае вкладок нет. А там где есть - нумеруем страницы до вкладки, вкладку пропускаем, нумеруем страницы после вкладки, продолжая основную нумерацию - какие проблемы то?

В акробате сделать всё вышеописанное в пару кликов не представляет проблемы....

Файнридер кастомную нумерацию при экспорте в PDF не поддерживает...Учитывая их ударенность головой в PDF и наличие у вас лицензии не на очень древнюю версию - можете написать в техподдержку фич-риквест.
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
На Форуме


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5569
Екатеринбург
Пол: male
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #95 - 28.03.2021 :: 13:46:09
 
niccolo писал(а) 28.03.2021 :: 13:14:25:
какие проблемы то?

безусловно, поработать чужими руками проблемы не составляет Улыбка никогда
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
AAW
Патриарх
*****
На Форуме


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5569
Екатеринбург
Пол: male
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #96 - 28.03.2021 :: 14:45:49
 
bolega писал(а) 28.03.2021 :: 09:32:27:
А DEEpro перестраивает гиперссылки при манипуляции страницами?

неа, не работает, проверил на версии 6.5 (Document Express 6.5 Professional)
about-картинка у него такая
...

Вот, блин, проблемы всплывают Улыбка
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
niccolo
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 185
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #97 - 28.03.2021 :: 16:23:14
 
Цитата:
безусловно, поработать чужими руками проблемы не составляет Улыбка никогда


Это вы верно подметили...

Но на это у военных (и не только) есть хорошая поговорка — кто не умеет работать головой, будет работать руками...
Наверх
 
 
IP записан
 
niccolo
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 185
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #98 - 28.03.2021 :: 16:44:57
 
AAW

Вы лучше подумайте, а сколько дополнительного времени будут терять пользователи из-за такой недодумки инженера, ну и как вишенка, что хорошо видно по Шломану, сколько потерянных страниц придётся потом доделывать.

При нумерации 1 в 1 все пропуски страниц ВИДНЫ СРАЗУ - открыл последнюю страницу и посмотрел, есть совпадение или нет....

И, учитывая Ваш перфекционизм, возможно стоит подумать и об интеграции Errata тех томов, где они есть, прямо в текст.
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
На Форуме


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5569
Екатеринбург
Пол: male
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #99 - 28.03.2021 :: 17:22:59
 
niccolo
Меня агитировать подумать не надо, я, как правило, думаю.
И в данном случае я думаю, что вы не додумали своё предложение от слова "совсем". Как у Винни-Пуха с правильнописанием: "оно хорошее, но оно хромает". Кому, например, из читателей нужно вычислять пропуски в скачанном pdf. Кому и зачем. Или как пронумеровать (обозначить) вкладку, если не арабскими цифрами. Нет от вас ни указания на стандарт, ни полновесного, исчерпывающего, предложения.
Первоначальное соображение высказано вами IMHO верно, нумерацию всяко удобнее иметь совпадающей с бумагой. Но развития идея не получила, в ваших последующих постах. Ограничились темой/песней "сделайте мне хорошо". На что я собственно и рассмеялся.

upd

мне тут в почту уже пишут умные люди: какие "проблемы"... удалил лишние страницы, распознал, добавил удаленное обратно.
Наверх
« Последняя редакция: 28.03.2021 :: 18:13:33 от AAW »  

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
niccolo
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 185
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #100 - 28.03.2021 :: 20:12:10
 
Цитата:
Как у Винни-Пуха с правильнописанием: "оно хорошее, но оно хромает". Кому, например, из читателей нужно вычислять пропуски в скачанном pdf.


Зачем читателю вычислять. Он увидит. А вот сканировщику/конвертеру такой индикатор не помешал бы....

Цитата:
Или как пронумеровать (обозначить) вкладку, если не арабскими цифрами.

Специально выделю ещё раз.
обложка + форзац + введение от I до XII - стр I-XV или a,b,c,d,e etc.

Экзотику, типа иероглифов, или двойную нумерацию, я даже не трогаю, хотя это просто само-собой разумеющиеся вещи.

Цитата:
удалил лишние страницы, распознал, добавил удаленное обратно.


Еще раз.
1) Мне не удалось добиться такого (меньшего) количества ошибок распознавания в своих результатах и со своим опытом, по сравнению с оригиналами в Архиве, распознанными без русского. В чём причина этого, я не знаю, но не исключаю пост OCR коррекции проприетарными алгоритмами исправления ошибок OCR гугля.
Поэтому я не вижу смысла плодить каки... Их уже и так наплодили... В архиве начали появляться версии словарей, снятые на DMark - качество получше, но с разворотами тоже беда....
Да и как погляжу, гигатома - 2 и 12, никто не рвётся сделать хорошо.

Глядя на то, как ФР во всех версиях умудряется распознавать невозможные для языков сочетания букв — уровень аналитической работы лингвистического отдела Abbyy за последние 10 лет — «0»....
Остальное вы и сами видите. Чем люди занимались с выхода 8 версии, кроме добавления нескольких языков и форматов, Я СОВСЕМ НЕ ПОНИМАЮ, но глядя на всё это я не советую покупать последние версии FR - проще на Авито купить за копейки какой-нибудь старенький Эпсон с FR8 в комплекте или просто старые версии...

2) Проблема в проверке ошибок и возможности работы с указателем тем, кто будет работать с файлами...
Попытайтесь получить удовольствие от т.14 - он уже выложен.... Заодно мозги арифметикой натренируете....

Возиться с мусором, чего-то из него составляя, зная что есть нормальные файлы, которые кто-то, где-то и надеюсь-доживу сделает, у меня нет желания.....Мне хватило ручной расстановки блоков во всех 17 томах, поиска, выдёргивания, распознавания страниц, которых в них нет и массы других вещей, чтобы привести всё к нормальному текстовому виду с картинками (правда страшненькими и подслеповатыми в отдельных томах - ну да кому надо и так поймёт, если в теме)

Всё это больше для тех, кто будет работать с хорошими файлами после меня...
Я уже свою работу почти заканчиваю. Как раз немного и французский и испанским вспомнил....
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
На Форуме


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5569
Екатеринбург
Пол: male
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #101 - 28.03.2021 :: 20:56:19
 
niccolo писал(а) 28.03.2021 :: 20:12:10:
А вот сканировщику

niccolo писал(а) 28.03.2021 :: 20:12:10:
Я уже свою работу почти заканчиваю

Угу. Понятно. Кому-то когда-то сделать хорошо. Даже если он никогда не попросит.
Примерно тот же смысл, что поставить огнетушитель рядом с урной, а то вдруг она загорится от бычка, а тушить нечем будет. Теоретически полезно.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
niccolo
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 185
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #102 - 28.03.2021 :: 23:01:50
 
Цитата:
Кому-то когда-то сделать хорошо. Даже если он никогда не попросит.


Ждал. В Abbyy сам написал...
Везде пишут, что с апреля Абби переходит на подписную систему... Может хоть шевелиться начнут....
Хотя больше кажется, что просто загнутся....
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
На Форуме


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5569
Екатеринбург
Пол: male
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #103 - 29.03.2021 :: 07:20:14
 
bolega писал(а) 28.03.2021 :: 09:32:27:
как можно сохранить работоспособность ссылок при перестановках страниц в djvu

Китаец тоже ответил утром, единственный вариант, ему известный, это экспортировать аннотации в текстовый файл, отредактировать его, и засунуть обратно DjvuToy.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
niccolo
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 185
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #104 - 30.03.2021 :: 00:41:34
 
Цитата:
Китаец тоже ответил утром, единственный вариант, ему известный, это экспортировать аннотации в текстовый файл, отредактировать его, и засунуть обратно DjvuToy.


Тогда наверное стоит добавить для конвертеров указание на то, что пока фича в DJVU не реализована, книжки с такой нумерацией временно выкладывать только в PDF?
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
На Форуме


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5569
Екатеринбург
Пол: male
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #105 - 30.03.2021 :: 05:50:27
 
niccolo писал(а) 30.03.2021 :: 00:41:34:
добавить для конвертеров указание

тут не Комитет стандартов Совета Министров СССР. Кто как хочет, тот так и делает.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
niccolo
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 185
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #106 - 07.04.2021 :: 19:42:47
 
Там 2 том не готов часом?
Или, даже лучше, картинки от него, если обработчик выделял их в СК.
А то буду проверять и исправлять соответствие картинок карточкам и хотелось бы нормальные картинки.

И второй вопрос - обработчик может выложить размеры обработанных страниц всех томов с полями или примеры, чтобы покумекать, чего сделать в ФР, чтобы попытаться с минимальными проблемами подменить файлы изображений в пакете с расставленными блоками?

В принципе как самый простой вариант видится скрипт в AutoIT, делающий следующие действия
1. Переход на страницу
2. Сохранение блоков в файл.
3. ПКМ - свойства страницы - перезагрузить страницу - и загрузка новой картинки
4. Загрузить блоки из файла.....

И так  по количеству страниц.... Способ геморройный но самый чистый с точки зрения программы. Простая подмена в программе часто вызывает цепочки каких-то исключений, после которых сама программа вываливается.....
Возможно, в следующих билдах Абби исправит недоработку с удалением блоков после любой обработки картинок и тогда всё станет проще, но пока так.

Приём не подойдёт при отличии разрешения файлов, т.к. в ФР нет масштабирования блоков....
Теоретически для таких сложных вещей, учитывая гораздо большие возможности СК, интерес могла бы представлять функция создания масок блоков под распознавание текста файнридером в СК в графическом виде с их поддержкой в ФР (типа слоёв масок для PCB - прозрачный PNG например, с рамками в 1 дот разного цвета) или в описательной текстовой форме....(если разобраться с форматом файлов Блоков в ФР) и потом наложение блоков через скрипт....
Вот такие идеи....

А в общем, затраты времени на наложение табличных блоков на страницы всех томов примерно сопоставимы или даже чуть больше затрат времени на сканирование.
Стоит ли заставлять обработчика по прихоти его тратить, дело ваше, AAW. Или он сам так хочет?



Наверх
 
 
IP записан
 
AAW
Патриарх
*****
На Форуме


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5569
Екатеринбург
Пол: male
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #107 - 07.04.2021 :: 20:30:24
 
niccolo писал(а) 07.04.2021 :: 19:42:47:
Стоит ли заставлять обработчика по прихоти его тратить, дело ваше, AAW

Я давно уже никого не "заставляю". Книги не дети безмозглые обрабатывают.
Кстати, обработчик словарей сюда не заглядывает.

оффтоп
Улыбка Как говорил капитан Блад полковнику Бишопу "К чему  насилие? Вам предоставляется  совершенно свободный  выбор между пером  и  веревкой.  Этот вопрос можете решить только вы сами.".
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
niccolo
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 185
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #108 - 08.04.2021 :: 19:54:34
 
Цитата:
Кстати, обработчик словарей сюда не заглядывает.


Я ни к нему и обращаюсь...

Цитата:
Как говорил капитан Блад полковнику Бишопу "К чему  насилие? Вам предоставляется  совершенно свободный  выбор между пером  и  веревкой.  Этот вопрос можете решить только вы сами.".


Мне больше нравится это
— Следователь сперва будет ласков. Он предложит папиросу, потом предложит жизнь...
Папиросу можно взять, а от жизни придётся отказаться.
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
На Форуме


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5569
Екатеринбург
Пол: male
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #109 - 08.04.2021 :: 20:24:18
 
niccolo писал(а) 08.04.2021 :: 19:54:34:
Я ни к нему и обращаюсь...

Я неточно выразился.
Он вас не уважает. В связи с уже имевшим место прецедентом (насчёт OCR) я ему и передавать не стану вашу просьбу, чтоб на меня это неуважение не переходило.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
niccolo
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 185
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #110 - 08.04.2021 :: 20:54:18
 
Цитата:
Я неточно выразился.


Так бы сразу и написали. Я не девочка - обижаться не буду...
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
На Форуме


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5569
Екатеринбург
Пол: male
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #111 - 12.04.2021 :: 14:10:54
 
том 2 положил. неполный.
http://publ.lib.ru/cgi/forum/YaBB.pl?num=1325496030/686#686
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
niccolo
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 185
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #112 - 12.04.2021 :: 15:34:37
 
Цитата:
том 2 положил. неполный.


Спасибо. Дальше, я так понимаю, алфавитные указатели?

Том 2 в Архиве 1906 или 1908 года. Где-то читал, что его второе издание, которое вы выложили, существенно дополнено.
Русский по первому взгляду послереформенный..... 

Нежданчик.....
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
На Форуме


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5569
Екатеринбург
Пол: male
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #113 - 12.04.2021 :: 15:42:30
 
niccolo писал(а) 12.04.2021 :: 15:34:37:
Дальше, я так понимаю, алфавитные указатели?

вероятно, они. Судя по содержанию.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
niccolo
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 185
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #114 - 16.04.2021 :: 01:48:20
 
Том 2
стр. 687-688 — дефекты, которые нужно восстановить
nombre (m) de kilowatt-heures
numero (m) [di] chilowatt-ore
número (m) de kilo-vatio-horas

максимуму

Нумерацию тоже желательно в акробате поправить.
Наверх
 
 
IP записан
 
niccolo
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 185
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #115 - 19.04.2021 :: 23:30:18
 
на стр. 293
п.10-14 к английскому переводу нужно добавить «oxide»
Наверх
 
 
IP записан
 
niccolo
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 185
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #116 - 25.05.2021 :: 13:40:24
 
Пока  общая безуказательная часть в Goldendict и Лингво выглядит так

... ... ... ... ...

Общее количество статей 134,7K (c двумя вариантами тома 2)
Наверх
 
 
IP записан
 
niccolo
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 185
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #117 - 27.07.2021 :: 16:17:06
 
Добавил русские переводы к 120 страницам тома 17 и собрал итальянский индекс. Надо будет пересобрать русский и итальянский варианты
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
На Форуме


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5569
Екатеринбург
Пол: male
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #118 - 28.07.2021 :: 04:22:10
 
второй том Шломана, с указателем, RU и DE. Но, блин, опять без обложек. Во редкость.
http://publ.lib.ru/cgi/forum/YaBB.pl?num=1325496030/689#689

В немецкой версии все 16 томов опредмечены на страницах XIX-XXIV. niccolo, вы сможете сделать их перевод отдельным файлом? Было бы удобно. Я и сам о таком сводном документе мечтал, когда фоткал, и обработчик сейчас предложил эту же идею.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
niccolo
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 185
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #119 - 28.07.2021 :: 16:21:05
 
Цитата:
В немецкой версии все 16 томов опредмечены на страницах XIX-XXIV. niccolo, вы сможете сделать их перевод отдельным файлом? Было бы удобно. Я и сам о таком сводном документе мечтал, когда фоткал, и обработчик сейчас предложил эту же идею.


Страницы XIX-XXIV — это просто предметные указатели....
Зачем делать их перевод - если есть русские файлы с этим переводом? (Судя по присланным вами когда-то фото обложек)

Удобно что или для чего?

Работая с оцифрованными книгами в ПДФ, абсолютное большинство ищет копи-пастом. Поэтому желательно распознавание всего текста (а в глубоком идеале адаптация оригинального текста к такому поиску).

Сделать это попроще можно следующим образом - разметить все картиночные зоны в СК, получить обработанные страницы в ФИНАЛЬНЫЙ РАЗМЕР но без картинок, распознать их даже в автомате FR, сохранить в PDFc текстом под или в пакет FR8 c текстом, а потом либо подменить изображения в ПДФ, либо создать ПДФ с текстом из FR8 - вроде какая-то программа может.

Моя цель — создание DSL файла. И сейчас мне даже не нужны сами файлы - я в рабочих материалах уже исправил массу ошибок исходных файлов - орфо, печати, неоднородности, а то Allgemeines - Общие термины - переведено в разных томах 3 или 4 разными вариантами, включая простое слово «Вообще»  — а нужны просто картинки из них - если обработчик выделял их при обработке...

PS. Большое спасибо за том 12.
Наверх
 
 
IP записан
 
Страниц: 1 2 3 4 5 6 
Послать Тему Печать