OCR форумы Добро пожаловать, Гость. Пожалуйста, выберите Вход или Регистрация
Форум переведен из кодировки UTF-8 в кодировку WINDOWS-1251. По всем вопросам, связанным с кодировкой текста (появлением «кракозябр»), обращайтесь к Администратору.
The forum is translated from the UTF-8 encoding to the WINDOWS-1251 encoding. For all questions related to the encoding of the text (the appearance of 'krakozyabr'), please contact the Administrator.
 
  ГлавнаяСправкаПоискВходРегистрация Администратор Библиотека  
 
Страниц: 1 2 3 4 5 6
Послать Тему Печать
Ищется А. Шломан - Иллюстрированный технический словарь на шести языках. (Прочитано 14521 раз)
niccolo
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 182
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #60 - 12.02.2021 :: 20:26:33
 
Цитата:
Примерно в том же, в чем смысл существования Давида Микеланджело. Так-то ведь просто кусок мрамора сложной формы, нафиг его берегут и показывают - непонятно. Пойди да выруби себе еще кусок, если хочешь.



Давид, Пьета  - это подлинники, если на то пошло.... А копии можно приравнять разве что к гипсовым поделкам в районных домах культуры. Они тоже могут быть хорошими....
Нежелание видеть содержание за формой, или превознесение формы над содержанием — это что? (вопрос философский - можно не отвечать).
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 4706
Екатеринбург
Пол: male
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #61 - 12.02.2021 :: 20:34:06
 
копии тоже могут быть хорошими. Ну, разверните уж эту "философскую мысль".
upd
А то в Давиде вас именно форма (подлинность) беспокоит, никак не содержание.
Наверх
« Последняя редакция: 13.02.2021 :: 06:20:29 от AAW »  

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
niccolo
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 182
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #62 - 03.03.2021 :: 14:51:06
 
В томе 9 отсутствуют развороты

224-225
384-385
Наверх
 
 
IP записан
 
xyz
Гуру
****
Вне Форума


Всем привет!

Сообщений: 724
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #63 - 03.03.2021 :: 20:22:15
 
в литресовских версиях этого тома есть
Наверх
 
 
IP записан
 
niccolo
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 182
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #64 - 03.03.2021 :: 22:16:57
 
Спасибо за инфо

Не люблю Литрес. В названиях даже номеров томов не видно....
Наверх
 
 
IP записан
 
niccolo
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 182
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #65 - 03.03.2021 :: 23:33:16
 
Кто-нибудь может подсказать, как заставить акробат сохранять ПДФ в Ч/Б растровые картинки в PNG/TIFF без наложения точечного растра?
Наверх
 
 
IP записан
 
xyz
Гуру
****
Вне Форума


Всем привет!

Сообщений: 724
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #66 - 04.03.2021 :: 05:44:58
 
Насколько я вижу, там у литреса две версии . Одна чисто ч.б.  Другая - часть картинок в сером.

Непонятно, что вы имеете в виду "без наложения точечного растра".
Догадываюсь, что акробат при бинаризации создает артефакты.
Так он для этого и не предназначен. Попробуйте в СК импортировать (можно не всю книгу, а только нужные странички) и уже в СК бинаризовать.

UPD
Или в сером сохраните, а потом запихните в СК
Наверх
« Последняя редакция: 04.03.2021 :: 07:15:01 от xyz »  
 
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 4706
Екатеринбург
Пол: male
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #67 - 04.03.2021 :: 07:27:04
 
niccolo писал(а) 03.03.2021 :: 23:33:16:
как заставить акробат сохранять ПДФ в Ч/Б растровые картинки в PNG/TIFF без наложения точечного растра?

Вы конкретизируйте задачу, дайте пример (файл-источник/скриншот результата/место или вид косяка/идеальный вариант). Используете многозначные термины, и непонятно что вам нужно.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
niccolo
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 182
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #68 - 04.03.2021 :: 10:43:58
 
В данном случае 9 том с Литреса


В Акробате масштабируется без проблем. Выбираю сохранить как - Другой - Изображения - TiFF или PNG
Получаю картинку с растром из белых точек, которые хорошо заметны при увеличении, причём независимо от того, какая картинка исходно - Ч/Б или Серая.

Выручает только сохранение в JPEG без потерь или не всегда принудительная конвертация при сохранении в серый

пример растра

...


SK не всегда корректно или точнее всегда некорректно всасывает многослойные изображения
Наверх
 
 
IP записан
 
niccolo
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 182
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #69 - 04.03.2021 :: 16:59:52
 
bolega

я не хаю, я констатирую факт, что мне так и не удалось добиться от SK приемлемого вытаскивания красных сканов из Archive pdf.

SK постоянно разбирает из их слои, половина из которых мусор....

При извлечении в цвете, я возможно тоже что-то не так выставляю, но артефакты извлечённого jpeg мне тоже не удалось побороть.... (не исключаю, что они есть в оригинале, но почему то в акробате картинка при одинаковом увеличении ДЛЯ МЕНЯ всегда выглядит лучше).

Просто если знаешь обходные пути, которые быстрее, чем разбираться - используешь их пока уже не достанет....
Вот теперь наверное достало, и хочется разобраться.....

В своё время я задал глупый как сейчас понимаю, вопрос о настройках для обработки таких книг. Но, понимаю, что на него не может быть общего ответа...

PS. А вашу программу во всех своих контактах с Абби я им всегда в пример ставлю в сравнении с их недоделкой.
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 4706
Екатеринбург
Пол: male
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #70 - 04.03.2021 :: 17:26:51
 
bolega, а можно каким-то способом подсветить все эти зоны (их границы)? А то часть невидимы. Фокус с замочком неудобен, маркером зон (желтой заливкой) тоже как-то некрасиво пользоваться.

оффтоп
это:
niccolo писал(а) 04.03.2021 :: 16:59:52:
SK не всегда корректно или точнее всегда некорректно всасывает многослойные изображения
...
факт, что мне так и не удалось добиться от SK

напомнило сцену
https://www.youtube.com/watch?v=g0YDmHwEe5A
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
niccolo
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 182
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #71 - 04.03.2021 :: 21:25:52
 
Цитата:
PDF от них это же кошмар, там жуткая сегментация с мылом и артефактами. JPG тоже слегка попорчен (пережат), но все равно на порядок лучше.


Кошмарные или нет - но текстовый слой у тех же шломанов без русского там по качеству такой, что мне не удалось добиться такого качества в FR.
Количество ошибок гораздо РАЗЫ меньше. Не могу понять - неужели добавление в ФР к распознаванию кириллицы так портит ситуацию, или там какими-то алгоритмами правили текст в ПДФ...

Поэтому не всё однозначно...
Наверх
 
 
IP записан
 
m7876
Постоялец
**
Вне Форума



Сообщений: 103
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #72 - 05.03.2021 :: 19:52:29
 
bolega писал(а) 04.03.2021 :: 17:48:07:
...если borrow - то исходные (почти) jpg ...

А как их найти? Я вижу только PDF, Daisy и EPUB...
Наверх
 
 
IP записан
 
niccolo
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 182
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #73 - 07.03.2021 :: 01:56:28
 
Цитата:
Я вижу только PDF, Daisy и EPUB...

Вероятно, потому, что они есть не для всех книг.

Цитата:
А что такое красные сканы?


Сканы старых пожелтевших от времени книг. Более красными они, полагаю, от обработки становятся.
Наверх
 
 
IP записан
 
m7876
Постоялец
**
Вне Форума



Сообщений: 103
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #74 - 07.03.2021 :: 04:32:40
 
А когда они (исходные JPG) на архиве.орг есть, то как их найти? Я перебрал множество книг "на абонемент", но никакого намека на эти файлы не обнаружил...
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 4706
Екатеринбург
Пол: male
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #75 - 07.03.2021 :: 07:17:03
 
m7876 писал(а) 07.03.2021 :: 04:32:40:
А когда они (исходные JPG) на архиве.орг есть, то как их найти?

Не спец по архив.орг, но вот взял ссылку от xyz на Шломана:
https://archive.org/download/bub_gb_tcs3AAAAMAAJ
Нажал "go to parent directory", попал во вьювер.
Справа внизу download options и JP2 ZIP. Не оно?

...
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
xyz
Гуру
****
Вне Форума


Всем привет!

Сообщений: 724
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #76 - 07.03.2021 :: 07:40:12
 
Нет, это не то. Это обычная книга в публичном доступе, а речь идет об абонементных "борроу".


Во-первых, можно утянуть и раскурочить закриптованный пдф. (Но полезут артефакты, так как они жмут лурой.)
Для чисто текстовых книг на самом деле пофигу.


Во-вторых, в гуглохроме можно руками сохранить постранично демонстрируемые броузером джипеги.
(Я для удобства, когда так делал, копипастил соответствующие ссылки из хрома в файерфокс.)


В-третьих, год назад тут на форуме такой диалог был:


Iskander писал(а) 06.02.2020 :: 16:04:42:
На архив.орг и для borrow-книг, и для других — файлы в лучшем качестве доступны в окне просмотра книги. Для него тоже есть скрипт, но пока не подготовленный для публикации.



bolega писал(а) 06.02.2020 :: 18:06:31:
Не советую вам его делать доступным для всех. Как только инструмент станет доступным каждому желающему, резко возрастет скачка borrow-книг, такое они сразу заметят. Чтобы сделать любой скрипт бесполезным, им достаточно изменить принцип именования файлов в кэше так, чтобы имя файла никоим образом не было связано с номером страницы. И тогда запаритесь подбирать последовательность, учитывая, что отсутствие номера на самой странице - очень частое явление.
Прежде чем осчастливить всех, подумайте о последствиях. Не пилите сук. И не думайте, что только вы один додумались до такого скрипта. Кому очень надо, тот знает как оттуда забрать в хорошем качестве.
Наверх
 
 
IP записан
 
m7876
Постоялец
**
Вне Форума



Сообщений: 103
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #77 - 07.03.2021 :: 09:19:15
 
Большое спасибо. Мне очень надо забрать оттуда две книги в хорошем качестве, в первом случае пдф просто нет (так бывает, у них все бывает), а во втором случае бледный скан был просто убит лурой. Обладатели Знания, пожалуйста, напишите в личку. Буду чрезвычайно благодарен.
Наверх
 
 
IP записан
 
xyz
Гуру
****
Вне Форума


Всем привет!

Сообщений: 724
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #78 - 07.03.2021 :: 12:25:19
 
А я правильно вас понимаю, что если "на лету" в броузере подменить этот xml, то есть шанс (через ридер) вытащить с правильной обрезкой ?
Наверх
 
 
IP записан
 
m7876
Постоялец
**
Вне Форума



Сообщений: 103
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #79 - 07.03.2021 :: 12:55:25
 
bolega писал(а) 07.03.2021 :: 12:45:07:
Если хотите, киньте ссылки на книгу. Я скачаю вам своим методом.

Спасибо!!! Написал в личку.
Наверх
 
 
IP записан
 
m7876
Постоялец
**
Вне Форума



Сообщений: 103
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #80 - 07.03.2021 :: 13:27:05
 
Да. Но если Вы сможете вытащить эту пару, дальше я уже сам Улыбка К тому же я не работаю под Windows...
Наверх
 
 
IP записан
 
m7876
Постоялец
**
Вне Форума



Сообщений: 103
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #81 - 07.03.2021 :: 20:28:03
 
Большое всем спасибо за помощь!
Наверх
 
 
IP записан
 
niccolo
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 182
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #82 - 12.03.2021 :: 18:00:22
 
Цитата:
Теперь я понял, почему у них практически на каждой странице всякие полосы, пятнышки или даже грязь размером с букву. Тряпочка для протирки у нее висит, но похоже ей никогда не пользуются.
И еще примерно каждая 10-я книга (по моему опыту) содержит от одной до 2-3 смазанных страниц, т.е. книгу трогали еще до того, как закончилось сканирование листа. Смазы бывают средние, а бывают практически нечитаемые.


Рукожопство без границ.... Смех Смех Смех
Это только навальнята верят, что там рай на земле и всё хорошо и правильно....
Наверх
 
 
IP записан
 
Lykas
Гуру
****
Вне Форума


Всем привет!

Сообщений: 744
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #83 - 12.03.2021 :: 21:48:12
 
niccolo писал(а) 12.03.2021 :: 18:00:22:
Рукожопство без границ.... Смех Смех Смех
Это только навальнята верят, что там рай на земле и всё хорошо и правильно....

Интересно не ждут ли Интернет-Архив те же грабли что и Гугля из-за авторского права и сканирования-выкладывания книг в Сеть?..
Наверх
 
 
IP записан
 
Lykas
Гуру
****
Вне Форума


Всем привет!

Сообщений: 744
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #84 - 12.03.2021 :: 23:14:37
 
bolega писал(а) 12.03.2021 :: 22:12:13:
Не смог найти ссылку, но наезд на них был в прошлом году серьезный.
Как все знают, там система абонементов как в обычной б-ке, человек ждет когда книга освободится и выписывает ее на две недели. Т.е. в каждый момент времени ее мог читать только один человек. Раз такое бесплатно возможно в обычной б-ке, то электронная в этом смысле ничем от нее не отличается. Как это ни удивительно, но это помогало отбиваться им от наездов правообладателей. Но случилась пандемия, закрылись учебные заведения и б-ки, и архив отменил все ограничения на чтение книг. Какое-то время издательства это терпели, но потом жаба стала душить их, и они подали иск в суд. То ли летом, то ли осенью. Архив вернул абонемент (но уже не на две недели, а на час!). И все вроде успокоились.

https://blog.archive.org/2020/07/22/libraries-have-been-bringing-older-books-to-...

https://blog.archive.org/2020/07/29/internet-archive-responds-to-publishers-laws...

И прошел этот номер?
Если я правильно помню, то еще в законе 1993 года запрещалось в том числе "сохранение в памяти компьютера"...  Улыбка
Интересно это тоже будут сканировать?
https://ia801506.us.archive.org/21/items/B-001-034-756-ALL/04-IMG_3403.JPG
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 4706
Екатеринбург
Пол: male
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #85 - 13.03.2021 :: 18:13:36
 
bolega писал(а) 12.03.2021 :: 22:12:13:
И все вроде успокоились.

очень прикольно...
Значит, заведи дополнительные доменные имена, обеспечь на каждом имени такую книговыдачу "одна книга - один человек", и уже авторское право не работает. Хотя база одна. Хм! Любопытно, куда подкопались, под само понятие е-копии. Верифицируемость "оригинала".
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 4706
Екатеринбург
Пол: male
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #86 - 13.03.2021 :: 21:26:02
 
bolega писал(а) 13.03.2021 :: 20:29:30:
копии, которые делают для себя библиотеки

Да, это интересный пробел в законодательстве. Например, НЭБ и региональная крупная библиотека, которая отдала НЭБ свои архивы (дала на него ссылки) - что тут вообще с легитимностью получения копии в НЭБ?? Лакуна.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
niccolo
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 182
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #87 - 27.03.2021 :: 18:12:18
 
Никто не подскажет самый простой способ исправить нумерацию в DJVU томе 2 с Архива (чтобы она совпадала с нумерацией страниц книги)?

И просьба к тем, кто делает тома - постарайтесь, чтобы нумерация страниц в книге совпадала с нумерацией страниц в файле.
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 4706
Екатеринбург
Пол: male
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #88 - 27.03.2021 :: 18:17:34
 
niccolo писал(а) 27.03.2021 :: 18:12:18:
чтобы нумерация страниц в книге совпадала с нумерацией страниц в файле

поясните.
в томах часто идет сначала римская нумерация введения, затем арабская. а дежавю-формат возможностей блочной нумерации (как у pdf) не имеет.
upd
вы в DEEPro элементарно можете перепаковать порядок блоками, как вам нужно.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
niccolo
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 182
Re: Ищется А. Шломан - Иллюстрированный технический словарь на шести языках.
Ответ #89 - 27.03.2021 :: 20:32:44
 
Цитата:
поясните.
в томах часто идет сначала римская нумерация введения, затем арабская. а дежавю-формат возможностей блочной нумерации (как у pdf) не имеет.


За исключением тома 1, где нумерация сквозная, в остальных томах введение пронумеровано отдельно.
Наверх
 
 
IP записан
 
Страниц: 1 2 3 4 5 6
Послать Тему Печать