OCR форумы Добро пожаловать, Гость. Пожалуйста, выберите Вход или Регистрация
Всем привет!
Hi all!
 
  ГлавнаяСправкаПоискВходРегистрация Администратор Библиотека  
 
Страниц: 1 2 3 4 
Послать Тему Печать
Re: djvused (метаданные) (Прочитано 9304 раз)
joker2156
Активист
***
Вне Форума



Сообщений: 306
Re: djvused (метаданные)
Ответ #60 - 13.05.2023 :: 04:55:09
 
nuget писал(а) 13.05.2023 :: 00:43:38:
можно, хотя бы, получить некоторую статистику... например, какая программа для обработки используется чаще, SK или ST?!...

Возможно имеет смысл решать задачу с другого конца - дайте людям утилиту - обработчик, который готов участвовать в "программе учета", будет с ее помощью генерировать метаинформацию и отсылать на некий централизованый сервер,  на котором будет хранится что книгу с хэшем\Md5 3423ac3448d.. обработал тот-то, там-то и тогда-то.. то бишь разнести физический носитель и базу, примерно как у меня с собой мои отпечатки пальцев, но где-то есть досье, одно с другим соотносится, но прекрасно живет независимо.
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5569
Екатеринбург
Пол: male
Re: djvused (метаданные)
Ответ #61 - 13.05.2023 :: 04:56:06
 
Lykas писал(а) 12.05.2023 :: 20:04:30:
Повторюсь. "Отлично" и "Достаточно" - у каждого свое...

Вы вопрос не уловили: в чём и почему "проблема" - ?

Принято считать что "проблема" - это нерешаемая на данном этапе задача. То есть нет известного пути её решения.

Для книгообработки "проблем" сейчас ну очень мало осталось. Даже замену глифами с помощью автозаполнения и то bolega сделал в СК. Остальное - не проблемы, а задачи, и это вне самого предметного поля книгообработки. Надо потратить на обработку неделю, а человек не хочет - корень таится в почему "не хочет", а не в "целая неделя же!!". Я тоже раньше маялся трудозатратами, а на той малоцветной НПБ-Ш, по которой видео писал, успокоился. Сколько надо затратить - столько и тратишь, иначе дело не сделаешь.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5569
Екатеринбург
Пол: male
Re: djvused (метаданные)
Ответ #62 - 13.05.2023 :: 05:09:39
 
оффтоп

joker2156 писал(а) 13.05.2023 :: 04:46:23:
А смысл? Верите, что в какой-то момент прозвучит "Алексей, мы знаем что вы много сканировали книг, Родина вами гордится, вот вам яхта"? Меня терзают смутные сомнения(с)..


при чём здесь яхта??

Я смотрю на новости с Украины, и у меня нет особенных сомнений, что реально существуют люди, которые хотят положить лично меня в гроб и сплясать около моей могилки. Их немного, Кургинян говорит что около миллиона, но пусть даже 10000, но они реально есть.
И эти люди реально поддерживаются западным ВПК. Я же вижу видосики с той стороны фронта, и какая экипировка. Какие буквы на снарядных ящиках и на стволах.
Таким образом, существует реальная угроза что на порог моей квартиры придёт человек, который захочет меня застрелить. И тут невозможно остаться в тени.
Ну а поскольку современные вооружения запускаются очень издалека, мне придётся для защиты жизни кооперироваться с такими же как я и отвечать аналогичным вооружением и самоорганизацией. Вплоть до сбивания спутниковых группировок. Что ведёт к само- и взаиморазвитию граждан, потому что боевой лазер это не винтовка, его на токарном станочке не сделаешь. Ну а как я буду помогать развиваться своим соседям, в маске что ли? Агентом под прикрытием? Придётся говорить от своего имени и никак иначе. Жить придётся. А не тихариться под VPNами и в даркнете. Нельзя защитить свою жизнь, говоря и действуя по типу "я это не я вовсе".
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
xyz
Гуру
****
Вне Форума


Всем привет!

Сообщений: 899
Re: djvused (метаданные)
Ответ #63 - 13.05.2023 :: 05:40:50
 
nuget писал(а) 12.05.2023 :: 10:25:27:
Всё намного проще. Достаточно определить пользовательские поля, например,

Поля специфические для сканированных книг (общие)
-- djvucreator: программа, в которой был создан DJVU-файл (например, SK).
-- scancreator: программа, которая использовалась для создания сканов.
-- scaneditor: по аналогии с полем editor, но имеет отношение к редактору исходных сканов.
-- scanowner: тот кто сканировал книги и предоставил исходный материал для создания DJVU.
-- djvudate: дата создания DJVU-файла.

Поля для определения текущей редакции
-- djvuedition: номер или дата текущей версии (в некоторых дистрибутивах Linux практикуется запись новой версии в формате даты, например 20230512-1. суффикс может отражать специфику редакции).
-- djvulastmodified: дата последнего изменения DJVU (не обязательно, если записывать поле djvuedition в формате даты).

По этим полям можно проследить историю изменений... Улыбка

Что-то я, кажется, стал понимать AAW, что тут не про облегчение жизни книгоделам, а про проверку завиральных теорий идёт речь ....  Печаль

Во-первых, часто для сканирования и обработки используется много программ (и что тогда в полях писать ?), а сканы книги собираются по частям не одним человеком. Во-вторых, бедный несчастный обработчик должен, получается, ещё и отчет о своей обработке создать. Да ну наф.
Я как обработчик готов вписать автора, название книги и год. Точка.
Вот еще готов критику на чужой файл навести, пусть где-то внутри будет инфа, чего там не хвататет и что хорошо бы переделать.
Если же вы хотите заполнение других полей, пускай программа сама шуршит и их из каких-то баз подтягивает и/или рассчитывает.


Условный же книжный менеджер нужен в первую очередь для групповых операций над файлами.

Нажал кнопку - всей группе выбранных книг сгенерировались и вписались в ячейки сигнатуры. (Однозначные, зависящие только от графики внутри файлов).

Еще чтобы было можно:
- сравнить по сигнатуре
- выбрать полное представление как в FAR - и список файлов отражается с их качественными характеристиками.
- отобразить облако тегов для всех файлов, которые есть в папке.
- подсветить в списке файлов книги, у которых в мете в поле тегов есть тег "полный бред" (ну или другой по выбору).
- сгенерировать список для экселя:      Автор - Название - год  .    (Возможно еще и теги включить).
- произвести ренейминг файлов. Автор - Название. PDF   из полей.  или сделать так чтобы стали латиницей писаться эти названия в именах.
- провести для отобранных файлов сверку с базами РГБ/РНБ/либген/ozon/labyrint     что там еще есть   на    предмет заполнения каких-то дополнительных полей.  (на основе уже имеющихся).
- продемонстрировать, какие обложки для этих книг в инете имеются.
- сгенерировать тумбнейлы обложек.   (Вот интересно, а микро-картинку можно в мету встраивать ?)
- отобразить (подсветить) файлы с указанными пользователем дефектами  (без OCR слоя, из фотосканов, с мелким разрешением, без обложки или где надо страницы досканировать.)     Я когда-то составлял на руборде таблицу типичных дефектов
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5569
Екатеринбург
Пол: male
Re: djvused (метаданные)
Ответ #64 - 13.05.2023 :: 06:13:53
 
xyz писал(а) 13.05.2023 :: 05:40:50:
Вот интересно, а микро-картинку можно в мету встраивать ?

метаданные в дежавю это пары текста ключ--значение. Внутри текстового же чанка ANTz.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
xyz
Гуру
****
Вне Форума


Всем привет!

Сообщений: 899
Re: djvused (метаданные)
Ответ #65 - 13.05.2023 :: 06:21:01
 
В джву существуют штатные тумбнейлы.
Мне кажется, теоретически, можно в мету загнать ссылку на тумбнейл обложки внутри файла.

Также можно сделать такую длинную строку (текстовое значение), которая будет побитовым представлением граффайла.
Наверх
 
 
IP записан
 
zvezdochiot
Постоялец
**
Вне Форума



Сообщений: 159
Москва
Пол: male
Re: djvused (метаданные)
Ответ #66 - 13.05.2023 :: 06:26:17
 
xyz писал(а) 13.05.2023 :: 06:21:01:
Также можно сделать такую длинную строку (текстовое значение), которая будет побитовым представлением граффайла.


"Это" называется проще и короче: base64. Подмигивание
Наверх
 

Keep it simple, stupid
WWW  
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5569
Екатеринбург
Пол: male
Re: djvused (метаданные)
Ответ #67 - 13.05.2023 :: 06:27:52
 
xyz писал(а) 13.05.2023 :: 06:21:01:
Также можно сделать такую длинную строку (текстовое значение), которая будет побитовым представлением граффайла.

да без проблем. А где взять прогу, которая это прочитает верно и отобразит.

joker2156 дело говорит насчёт отпечатков пальцев.
Вполне вероятно что я соглашусь открыть свой комп, раз уж он у меня с белым адресом ради фтп, на такой "централизованный сервер". И буду архив регулярно в торрент сбрасывать. Но пока не созрел.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
nuget
Новичок
*
Вне Форума


Всем привет!

Сообщений: 28
Re: djvused (метаданные)
Ответ #68 - 13.05.2023 :: 06:39:06
 
xyz писал(а) 13.05.2023 :: 05:40:50:
Что-то я, кажется, стал понимать AAW, что тут не про облегчение жизни книгоделам, а про проверку завиральных теорий идёт речь ....

Это пользовательские поля, их вообще можно не заполнять, или заполнять по желанию... Я просто предложил варианты, но если важна конфиденциальность, тогда остаётся только один вариант, использовать два поля:
-- djvuuuid: универсальный идентификатор UUID (или GUID в windows);
-- djvudate: дата создания DJVU-файла.

В данном случае, конфиденциальность возможна только при условии, если никто не будет знать, где публикуется издание, чтобы никто не смог связать ник пользователя на форуме с UUID.

Для пользователей windows, GUID можно получить средствами PowerShell следующей командой:
Code:
New-Guid
 



Важно, чтобы в каждой новой версии был один и тот же UUID.

Таким образом, тот кто обрабатывал сканы может индивидуально отслеживать свои экземпляры. А другим будет доступна только история изменений.
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5569
Екатеринбург
Пол: male
Re: djvused (метаданные)
Ответ #69 - 13.05.2023 :: 10:38:32
 
nuget писал(а) 13.05.2023 :: 06:39:06:
тот кто обрабатывал сканы может индивидуально отслеживать свои экземпляры. А другим будет доступна только история изменений

видимо, моих мозгов не хватает... зачем кому-то переделывать дежавюшку, с сохранением исходных метаданных?! Такое бывает в единичных случаях - вставка/замена пары страниц.

Если надо что-то "протаскивать насквозь" - то уж никак не эфемерный id. Каталожную карточку. id в госбазе. isbn или номер стандарта. Кому может понадобиться тащить свой идентификатор сквозь улучшателей е-книги, я даже вообразить не могу. В смысле не кому, а с какой целью.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
joker2156
Активист
***
Вне Форума



Сообщений: 306
Re: djvused (метаданные)
Ответ #70 - 15.05.2023 :: 06:16:04
 
AAW писал(а) 13.05.2023 :: 05:09:39:
при чём здесь яхта??
Я смотрю на новости

А, понял, я подумал что речь идет про книгоделание и в разрезе деанона ролей.
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5569
Екатеринбург
Пол: male
Re: djvused (метаданные)
Ответ #71 - 15.05.2023 :: 06:41:33
 
joker2156 писал(а) 15.05.2023 :: 06:16:04:
я подумал что речь идет про книгоделание и в разрезе деанона ролей

именно в этом разрезе, вы правильно подумали.
Я на 90% занимаюсь публичными делами потому что на это есть запрос других людей. Мои личные хотелки, не пересекающиеся с другими людьми, не требуют выхода в Сеть. Совсем. Так вот кооперация "в маске" в книгоделании не продержится долго.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
nuget
Новичок
*
Вне Форума


Всем привет!

Сообщений: 28
Re: djvused (метаданные)
Ответ #72 - 15.05.2023 :: 13:41:33
 
AAW писал(а) 13.05.2023 :: 10:38:32:
зачем кому-то переделывать дежавюшку, с сохранением исходных метаданных?

Вы же сами писали что-то про несколько экземпляров на Libgen… или нет?

Судя по всему, если @bolega не добавит GUI для встраивания метаданных, так и будет продолжаться. В принципе, можно было хотя бы встроить поля djvucreator и djvudate на этапе пост-обработки DJVU (для этого не нужен GUI).
Наверх
 
 
IP записан
 
xyz
Гуру
****
Вне Форума


Всем привет!

Сообщений: 899
Re: djvused (метаданные)
Ответ #73 - 15.05.2023 :: 18:59:02
 
nuget писал(а) 10.05.2023 :: 08:20:00:
Когда я предоставил скрипты, то интереса особого не увидел. Возможно это связано с MSYS2, поскольку скрипты написаны под Linux. На самом деле, меня интересует обратная связь, для более точного понимания технологического процесса. Возможно, я мог бы помочь в разработке инструментов.


nuget писал(а) 15.05.2023 :: 13:41:33:
Судя по всему, если @bolega не добавит GUI для встраивания метаданных, так и будет продолжаться.



Редактирования меты в СК, конечно, не хватало.

Я-то думал, тут какая-то разработка полезного софта планируется.

UPD:
Вычитал тут в википедии, что FAR на гитхаб выложили, и активно плагины к нему пилят:
https://ru.wikipedia.org/wiki/FAR_Manager
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5569
Екатеринбург
Пол: male
Re: djvused (метаданные)
Ответ #74 - 15.05.2023 :: 21:17:43
 
nuget писал(а) 15.05.2023 :: 13:41:33:
Вы же сами писали что-то про несколько экземпляров на Libgen

писал.
Вы не уловили вопрос: зачем?? зачем сохранять старые метаданные, добавляя/удаляя страницы или ocr. Я ещё могу понять, когда добавив ocr про это гордо упоминают логотипчиком или текстом в уголке титульника или в названии файла. А старое-то зачем тащить - ? Что вот этот файл сделал "xyz", инфу сохранить, а что я обложку в нем переместил - даже не упомянуть, а просто после "xyz" "aaw" дописать в поле "обработчики". Ну нахрена?

Польза от метаданных, ИМХО, лежит в трех направлениях:
- вытаскивание автора-названия-года-серии и всей библиографической требухи, включая субзадачи поиска и переименования и создания бибсписков
- хранение сведений об обработчике и/или качестве обработке/примененных программах
- понимание, что несколько файлов имеют один первоисточник, причем не железно, а вероятно

У третьего направления практической пользы ровно ноль (поправьте если неправ)
У первого польза сомнительная, но всё же просматривается: допустим, кто-то с ФИО название файла начинает, а кто-то с названия книги. Или, допустим, кому-то надо семьсот книг в свою научную работу внести, и метаданные помогут его сгенерировать.
И лишь у второго направления есть практическая польза. Отбор по оси "качества". То, чего нигде и никак не существует на планете. Только в наших головах.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5569
Екатеринбург
Пол: male
Re: djvused (метаданные)
Ответ #75 - 15.05.2023 :: 21:25:36
 
xyz писал(а) 15.05.2023 :: 18:59:02:
Редактирования меты в СК, конечно, не хватало.

nuget писал(а) 15.05.2023 :: 13:41:33:
если @bolega не добавит GUI для встраивания метаданных, так и будет продолжаться

ерунда полная. Есть много обработчиков, кто не работает с СК от слова совсем.
Дайте инструмент того же типа что колхозный  namecreator, и будет вам счастье. С просмотром и правкой pdf и djvu в одном флаконе. Тогда машинка - вероятно - завертится.

UPD
кстати, проконсультируйте кто-нибудь сведущий меня как не-программиста: это что, так сильно геморройно, вытащить из djvulibre исходный код для правки и просмотра метаданных в простейшем gui ?
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
xyz
Гуру
****
Вне Форума


Всем привет!

Сообщений: 899
Re: djvused (метаданные)
Ответ #76 - 15.05.2023 :: 23:37:55
 
Я пропустил слово "только" в посте выше.
= только не хватало
Наверх
 
 
IP записан
 
nuget
Новичок
*
Вне Форума


Всем привет!

Сообщений: 28
Re: djvused (метаданные)
Ответ #77 - 16.05.2023 :: 01:00:13
 
AAW писал(а) 15.05.2023 :: 21:25:36:
это что, так сильно геморройно, вытащить из djvulibre исходный код для правки и просмотра метаданных в простейшем gui ?

По сути, нужно реализовать интерфейс в SK, который мог бы читать и записывать файл book.djvuinfo. А запись в DJVU осуществляется через команду, на этапе пост-обработки:
Code:
djvused "book.djvu" -f "book.djvuinfo"
 


Эта команда просто перезапишет существующие данные в DJVU. Из DJVU не нужно ничего выгружать, если ранее был создан файл book.djvuinfo.
Наверх
 
 
IP записан
 
zvezdochiot
Постоялец
**
Вне Форума



Сообщений: 159
Москва
Пол: male
Re: djvused (метаданные)
Ответ #78 - 16.05.2023 :: 04:18:50
 
AAW писал(а) 15.05.2023 :: 21:25:36:
это что, так сильно геморройно, вытащить из djvulibre исходный код для правки и просмотра метаданных в простейшем gui ?

DjVuLibre - хороший "инструмент" для пользования, но отвратительнейшая библиотека для разработки. Я не знаю ни одного проекта, использующего данную библиотеку, который можно было бы скомпилировать, имея только саму библиотеку и её хедэры (совершенно стандартная ситуация для любой другой библиотеки, например libjpeg, libpng, или libtiff). Для этой же библиотеки надо иметь её исходный код полность, чтобы под неё что то скомпилить (абсолютно вымораживающая ситуация). То есть по сути приходится её компилировать каждый раз, когда нужно скомпилировать что то, что её пользует. Такие вот дела.

Так что ежели возник вопрос "портирования", то портировать надо из этой библиотеки, а не в неё или к ней.
Наверх
« Последняя редакция: 16.05.2023 :: 04:35:56 от zvezdochiot »  

Keep it simple, stupid
WWW  
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5569
Екатеринбург
Пол: male
Re: djvused (метаданные)
Ответ #79 - 16.05.2023 :: 05:01:42
 
спасибо. теперь вроде попонятнее, но не намного. я спросил - так ли сложно использовать её код. И почему, собственно.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
zvezdochiot
Постоялец
**
Вне Форума



Сообщений: 159
Москва
Пол: male
Re: djvused (метаданные)
Ответ #80 - 16.05.2023 :: 05:17:38
 
AAW писал(а) 16.05.2023 :: 05:01:42:
И почему, собственно.


Давай попробую на примере.

Есть MFBpdf - простенькая тулза производящая трёхслойное (Mask+FG+BG) разложение и кодирование в PDF изображения. Пользует библиотеки libtiff и libjpeg. Никаких проблем. Прекрасно всё компилится в MinGW.

Есть MFBdjvu - такая же простенькая тулза, но результат кодируется в DjVu. Пользует библиотеку DjVuLibre. Нифига не компилится в  MinGW. Потому что требует компиляции самой DjVuLibre, а это осуществляется через какие то жуткие танцы с бубном, требующие так же конкретного засирания системы откровенным калом. Поэтому мне приходится обращаться к @plzombie (который сидит на винде), чтобы он скомпилил виндовский релиз для меня. Ситуация просто "СУПЕР"! Откровенейший отстой!

PS: Всё вышесказанное является только моим ИМХО, ИМХО любителя-самоучки.
Наверх
 

Keep it simple, stupid
WWW  
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5569
Екатеринбург
Пол: male
Re: djvused (метаданные)
Ответ #81 - 16.05.2023 :: 05:34:33
 
да я понял.

вопрос в другом:
всё равно каждая библиотека это набор именованных функций, как ни крути. В чём сложность использовать функции либы в gui. Ну, там, "открыть поток метаданных", "найти пятнадцатую страницу в потоке страниц", "записать в открытый объект страницы метаданные из переменной NN".

Есть джавовская программка djvued. Она работает, но - блин - на основе готового djvused. И ощутимо медленно. И gui некрасивый. Вот такую же создать бы, но пошустрее. Писали ведь раньше подобные прожки, и довольно многие. Тот же djvu imager.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
zvezdochiot
Постоялец
**
Вне Форума



Сообщений: 159
Москва
Пол: male
Re: djvused (метаданные)
Ответ #82 - 16.05.2023 :: 05:41:30
 
AAW писал(а) 16.05.2023 :: 05:34:33:
вопрос в другом:
всё равно каждая библиотека это набор именованных функций.

Не в данном случае. В данном случае имеется набор мудрённых классов, которые даже отдебажить толком не получится если что. И эти классы все повязаны между собой, так что взять для пользования отдельный кусочек не выйдет. А еще вся либа на кой то чорт повязана с целым набором графических библиотек, которые пользуются довольно "хитрым" образом. Так что даже пересесть на другую либу (Qt например) не получится.

Наверх
 

Keep it simple, stupid
WWW  
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5569
Екатеринбург
Пол: male
Re: djvused (метаданные)
Ответ #83 - 16.05.2023 :: 05:45:16
 
ясненько Печаль

Странно, зачем так. Ведь внешне спецификация на джву формат совсем несложная. Нафиг разрабы делали библиотеку сверхзапутанной.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5569
Екатеринбург
Пол: male
Re: djvused (метаданные)
Ответ #84 - 16.05.2023 :: 06:46:57
 
Улыбка  а если djvuSDK взять?

( ежели вдруг нигде нет, то вот годичной давности скачанное с cuminas https://disk.yandex.ru/d/2dJ3NghQI-MRVA)
Наверх
« Последняя редакция: 16.05.2023 :: 07:52:57 от AAW »  

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5569
Екатеринбург
Пол: male
Re: djvused (метаданные)
Ответ #85 - 16.05.2023 :: 08:05:44
 
bolega писал(а) 16.05.2023 :: 07:59:33:
А уж ваше стремление к применению именно sdk мне вообще непонятно

наличие djvulibre или её компонент не желательно для легкой портативной программки.

bolega писал(а) 16.05.2023 :: 07:59:33:
то боюсь, эффект будет небольшой, если в итоге ввод данных будет весь ручной

я gui и хочу чтобы копипастить из ocr слоя.
в идеале бы вообще парсер стандартного описания применить. копируем вот это:

ББК 88.2
Ф91
УДК 591.5
Фройде М.
Ф91 Животные строят: Пер. с нем./Пре-
дисл. А. А. Захарова. — М.: Мир, 1986. —
216 с, ил.
Научно-популярная книга бнолога из ГДР Матнаса
Фройде, посвященная разнообразной строительной 
деятельности животных: созданию ловушек, кладовых,
убежищ, жнлых сооружений. Текст сопровождается 
красочными иллюстрациями.
Для любителей литературы о животных.

Подправляем руками явные ошибки и переносы,выбираем версию парсера и получаем авторазбивку этого мусора по полям метаданных.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
zvezdochiot
Постоялец
**
Вне Форума



Сообщений: 159
Москва
Пол: male
Re: djvused (метаданные)
Ответ #86 - 16.05.2023 :: 08:19:12
 
AAW писал(а) 16.05.2023 :: 08:05:44:
Подправляем руками явные ошибки и переносы,выбираем версию парсера и получаем авторазбивку этого мусора по полям метаданных.

Опять какая то дичь получится.

Альтернативный вариант: Стравливаем неважно каким образом проге текст. Прога парсит текст построчно. Для каждой строки выбираем из списка ключ меты либо игнор. Опционально предусматривается редактирование текста с возможностью перезапуска парсера.

PS: Только нет никакой необходимости связываться с DjVuLibre. Достаточно просто генерить файл для djvused.
Наверх
« Последняя редакция: 16.05.2023 :: 08:26:03 от zvezdochiot »  

Keep it simple, stupid
WWW  
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5569
Екатеринбург
Пол: male
Re: djvused (метаданные)
Ответ #87 - 16.05.2023 :: 08:24:01
 
zvezdochiot писал(а) 16.05.2023 :: 08:19:12:
Для каждой строки выбираем из списка ключ поля либо игнор.

это неэффективно, так как бибописания в книге строятся несколькими стандартными способами. Эффективнее частные парсеры написать.
Как модули в скачивалке usd.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
zvezdochiot
Постоялец
**
Вне Форума



Сообщений: 159
Москва
Пол: male
Re: djvused (метаданные)
Ответ #88 - 16.05.2023 :: 08:29:20
 
AAW писал(а) 16.05.2023 :: 08:24:01:
это неэффективно, так как бибописания в книге строятся

А кто сказал, что текст должен быть именно бибописанием? Связываться чисто с бибописанием - очень "скучный" и не очень эффективный вариант в самой основе. Бибописания повреждено либо утрачено? Пиши пропало.

Наверх
 

Keep it simple, stupid
WWW  
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5569
Екатеринбург
Пол: male
Re: djvused (метаданные)
Ответ #89 - 16.05.2023 :: 08:33:47
 
не "пиши пропало", а достань его с каталожной карточки/с rusmarc РГБ/сайта амазона/etc. Бибзапись нужно искать, она же всегда где-то есть.

к слову, приколисты РГБ запретили брать бибописание книги файлом, если я не зареган на госуслугах, да еще и через ЕСИА. Ну просто пять баллов.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
Страниц: 1 2 3 4 
Послать Тему Печать