OCR форумы Добро пожаловать, Гость. Пожалуйста, выберите Вход или Регистрация
Всем привет!
Hi all!
 
  ГлавнаяСправкаПоискВходРегистрация Администратор Библиотека  
 
Страниц: 1 2 3 4 
Послать Тему Печать
Re: djvused (метаданные) (Прочитано 8629 раз)
Геолог
Патриарх
*****
Вне Форума


Всем привет!

Сообщений: 1511
Пол: male
Re: djvused (метаданные)
Ответ #30 - 10.05.2023 :: 18:12:35
 
nuget писал(а) 10.05.2023 :: 13:59:55:
Сотрудничество, в смысле согласованности целей сообщества, если таковые имеются...

Это нтересно Улыбка
Давно у нас не было столь живой дискуссии.
"nuget" не сдавайся, идея интересная, и, мягко говоря, давно перезревшая.

Книги сканируют и оцифровывают уже многие, библиотеки и личные и с онлайн доступом, совершенно различного уровня, уже даже сложно охватить одним взором. Как только выхожу в интернет, каждый раз нахожу один, иногда более новых порталов. И каждая библиотека работает по своему, доморещенному, разумению. Одни просто накидывают книги в кучу, по типу финской поленицы, другие делают тематические подборки, наиболее продвинутые делают поисковые системы с различным уровнем сложности и поиском по тегам.
Принять какой либо единый и универсальный формат, приемлимый для всего сообщества, практичеси нереально. Как там у Пушкина - "В одну телегу впрячь не можно, Коня и трепетную лань". Народ форумный своеволен, не терпит над собой управы, и не готов работать по принуждению. А любые рамки, форматы, по свое сути, есть принуждение.
Посему и не надо стараться всем угодить. Надо создать круг заинтересованных, в узком кругу разработать формат представления данных в гипотетической, универсальной, идеальной (от слова Совершенство) Библиотеке. И представить творение Миру.
Мир конечно возмутится, отринет и оплюет. Спокойно выслушать его, и опираясь на Совершенство, где то дать Миру слабину, а где то и подвинуть Мир, в сторону Совершенства. И предоставлять Миру второй, третий  и надцатый вариант приблежения к Совершенству. Этот шутовской план, если подумать, не так уж и плох.
А если серьезно, то:
- потребность в унификации библиотек, уже перезрела, нынешнее положение неприемлимо,
- заставить всех работать в одном формате невозможно,
- можно разработать приемлемый формат, устраивающий часть сообщества,
- при достаточном упорстве и учтении многих пожеланий, формат, со временем, может принять большая часть сообщества,
- остальные либо примут формат по факту его общепринятости, либо им это вообще не интересно, в таком случае их мнение так-же никого не интересует, и собственно его даже озвучивать и воспринимать не имеет смысла.

А вообще, идея моментальной интеграции, полученных со стороны электронных книг в частную или общественную библиотеку великолепна. Она позволит спасти собственно сам обмен книгами, когда онлайн окончательно зажмут всевозможные правообладатели. Поисковики все более странны в поиске, библиотеки множатся и дробятся, а найти то что уже было оцифровано ранее, все труднее. В конце-концов, все может рухнуть опять на уровень передачи файлов по прямым запросам знакомых по личной цепи знакомств, и даже проста с диска на диск. И в этом случае единый формат метаданных, станет спасательным кругом для ищущих Знаний.
Наверх
« Последняя редакция: 10.05.2023 :: 18:43:55 от Геолог »  
 
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5544
Екатеринбург
Пол: male
Re: djvused (метаданные)
Ответ #31 - 10.05.2023 :: 18:29:14
 
Геолог писал(а) 10.05.2023 :: 18:12:35:
идея моментальной интеграции, полученных со стороны электронных книг в частную или общественную библиотеку великолепна

Угу. Есть пачка файлов, и к ним приложено json-описание. Это приблизительно то, что надо. Вопрос в сложном gui. Импорт-экспорт и показ. Почему я к викидвижку и пришёл в рассуждениях о том, что нужно от gui.

А ещё нужна ЭЦП. Для верификации.
Наверх
« Последняя редакция: 10.05.2023 :: 20:15:57 от AAW »  

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
Lykas
Патриарх
*****
Вне Форума


Всем привет!

Сообщений: 1124
Re: djvused (метаданные)
Ответ #32 - 10.05.2023 :: 18:46:20
 
AAW писал(а) 10.05.2023 :: 12:22:47:
Но я твёрдо выучил, что любое совместное дело требует согласия, а оно - как говорил электрик в 12 стульях - "есть продукт при полном непротивлении сторон". Вы о сообществе говорите - а перечислите мне членов вами упомянутого сообщества, согласных хоть в чём-либо. Конкретных субъектов. Я тридцать три раза орал на руборде - нужна библиографическая база, связывающая md5 и РГБ, с полями по качеству, готов заполнять если наберутся заинтересованные на долгий труд люди. Будут люди - можно обсуждать форматы.  И что? По нулям. С субъектов всё начинается, а не с предложений. А у субъектов - с их задач.
И раз людей не набирается, я сам шуршу. Поднял в апреле wiki дома, потренироваться. Понять, а в чём конкретно будут проблемы при заполнении такой "базы про качество".

[url]https://i121.fastpic.org/thumb/2023/0509/e8/8be674884272c208db66a13599f80de...[/URL]

ИМХО стоит есть слона по кусочкам.
По поводу привязки библио-информации книги именно к РГБ для однозначной идентификации согласен.
Метаданные в Djvu - в принципе не помешает, но нет верификации этой информации. И это с учетом того, что md5 файла определить можно, но внутрь этого файла не запишешь, т.к. это приведет к изменению этого идентификатора.
Как вариант, вшивать метаданные в Djvu. И одновременно дублировать в подобие fbd (где можно указывать и md5 файла). И на основе связки Djvu+Fbd формировать свою библиотеку. Архивы с такой связкой являются стандартными для Либрусека для не Fb2-файлов.
Цитата:
А вообще, идея моментальной интеграции, полученных со стороны электронных книг в частную или общественную библиотеку великолепна.

Когда-то на одном из сайтов посвященных спутниковой рыбалке была программка по переименованию нарыбаченных файлов по md5. На текущий момент, можно написать программку. которая может сделать запрос на Либген по md5, и по полученным данным переименовать файл. Но опять же - полнота библио-данных.
https://search.rsl.ru/ru/record/01002765308
Три автора. Напрямую ФИО можно взять одного, два других - только инициалы.
При желании на последней странице можно взять ФИО полные.

Наверх
« Последняя редакция: 10.05.2023 :: 19:07:24 от Lykas »  
 
IP записан
 
joker2156
Активист
***
Вне Форума



Сообщений: 305
Re: djvused (метаданные)
Ответ #33 - 11.05.2023 :: 07:50:33
 
Вставлю две копейки, в основном поддержав xyz ("..сделать книжный менеджер.."). Если я не вкурил о чем вообще речь - извините, что я в калашный ряд запёрся в графоманском настроении Улыбка. Возможно пропустил, но не увидел какая преследуется цель и сценарии использования? Для подавляющего большинства "пользователей", я уверен, всякая дополнительная библиографическая информация ценности не представляет (например организация ее в отдельных сущностях - идея мертворожденная. Я сам удаляю всякие file.info, checksum.txt, md5.dat и т.п. - они мне на хер не сдались, хранить этот хлам ради эфемерной возможности что кому-то когда-то может пригодится. Это моя личная библиотека, и, по правде говоря, я вообще сомневаюсь что она не отправится в мусорку сразу после моей смерти.) Мне, как представителю легиона, обычно достаточно раздела, автора, названия, года издания и номера издания - последние два атрибута, чаще всего для технических книг. Еще, если качество сильно говенное, но лучше нет в доступе - помечаю тоже. Итого, все это помещается в название + раздел.
Потому что для меня основной сценарий - поиск по каким-то критериям, где это лежит, сравнение того что уже есть с новыми вариантами (именно на этом сценарим и основываются мои рассуждения здесь). И используется для этого либо файл-менеджер, если поиск по локальным дискам, либо каталогизатор. Все. Думаю многим и этого не надо, свалено в несколько кучек по папкам "фантастика", "детективы", "учёба".
На хоть какое-то распространение метаинформации можно надеяться только если она будет легко доступна, полезна многим, удобна к редактированию и обмену. Т.е. нужно чтобы либо "проводник" научился обрабатывать дополнительные поля, либо искать\создавать удобный каталогизатор, желательно бесплатный, open source, легко устанавливающийся и легкий в использовании. Звучит как утопия. Хотя для звуковых файлов уже научились показывать информацию в проводнике.
Мне лично вообще не удалось найти библио каталогизатора которым хотелось бы пользоваться.
Для музыки использую древнию MPEG Audio collection, для всего остального - whereisit, который тоже не поддерживается, впрочем появился некий потомок Wincatalog (платный), который даже умеет импортировать базу whereisit. В принципе, whereisit, при добавлении новых объектов, умеет подтаскивать доступные метаданные и на уровне файла, и на уровне каталогов (типа file_id.diz), включает описание в поиск, умеет импортировать описания дополнительно из сторонних файлов (не пользовался) и имеет частично настраиваемый генератор отчетов. Но на роль общепринятого каталогизатора едва ли подойдет.

Еще существует малореальный вариант  протолкнуть идею поддержки чего то похожего на ID3, но для PDF и Djvu - тогда еще на что-то можно надеятся.

Вобщем, надо начать с постановки задачи: что нужно, кому и зачем. Придумать как заинтересовать пользователей в добавлении этой информации. Потом определяться с тем, чего конкретно не хватает ну и уже потом пытаться понять как воплотить. Потому что основных вариантов, вобщем, всего три - либо создавать и насаждать некую "стандартную" программу работы с книгами, либо создавать некую централизованую базу и искать методы сопоставления файла с записью базы, либо довольствоваться тем что есть, типа упомянутого djvused или проводника - в win10 для djvu в пропертях доступны довольно много потенциально полезных полей - subject, rating, tags, comments, etc., но пару ленивых попыток поменять их ни к чему не привели, хучь и администратор, а все равно редактировать не дает. Вроде есть некий редактор www.petges.lu, но тоже не пользовался.

Как вариант - либген вот, например, используется многими, имеет кучу дополнительных полей - можно начать с добавления своих книг, которых там нет, с добавлением данных, либо сопоставления тех что есть. Думаю, если приспичит и будет разумная аргументация - можно и с владельцами сайта пообщаться на предмет расширения метаполей. Сопоставлять - да хоть по той же md5, насколько помню это поле есть.
Наверх
 
 
IP записан
 
zvezdochiot
Постоялец
**
Вне Форума



Сообщений: 159
Москва
Пол: male
Re: djvused (метаданные)
Ответ #34 - 11.05.2023 :: 08:52:51
 
joker2156 писал(а) 11.05.2023 :: 07:50:33:
Еще существует малореальный вариант  протолкнуть идею поддержки чего то похожего на ID3, но для PDF и Djvu.

Так это уже есть и это называется мета. Только вот ежели для DjVu - это любые ключи и значения (что в голову взбредёт), то с Adobe и PDF только то, что "они" соизволили:
Title, Author, Subject, Keywords, Creator, Producer, CreationDate, ModDate.


PS: Я думал, что тема об "этом", а не о чём то ином. ;(
Наверх
 

Keep it simple, stupid
WWW  
IP записан
 
xyz
Гуру
****
Вне Форума


Всем привет!

Сообщений: 890
Re: djvused (метаданные)
Ответ #35 - 11.05.2023 :: 09:08:08
 
zvezdochiot писал(а) 11.05.2023 :: 08:52:51:
Так это уже есть и это называется мета. Только вот ежели для DjVu - это любые ключи и значения (что в голову взбредёт), то с Adobe и PDF только то, что "они" соизволили:
Title, Author, Subject, Keywords, Creator, Producer, CreationDate, ModDate.



болега же указал, что в pdf  можно свои собственные поля назначать.



zvezdochiot писал(а) 11.05.2023 :: 08:52:51:
PS: Я думал, что тема об "этом", а не о чём то ином. ;(


Был задан вопрос "что мешает людям это делать" ?  (заполнять мету)

На это коллективными усилиями был сформулирован ответ, что такая постановка вопроса неправильна, надо спрашивать: "зачем не-библиотекарям заполнять мета" ?    Судя по всему, это заполнение может быть побочным результатом решения каких-то их личных пользовательских задач. (UPD: Ну, и если им это решение задач обустроить, то на выходе можно и мету собирать.)
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5544
Екатеринбург
Пол: male
Re: djvused (метаданные)
Ответ #36 - 11.05.2023 :: 09:32:33
 
как-то не в фокусе внимания, что изменение файла книги меняет его хэш, а это ведёт к сложностям при последующем сопоставлении с крупными старыми базами, ЛГ и твирпкс. Теряется однозначность связывания. Там и так частенько по 7-8 версий книги (в ЛГ).

UPD
!! и вот чего сильно хочется, так это md5 в данной библиотеке.
Наверх
« Последняя редакция: 11.05.2023 :: 09:45:02 от AAW »  

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
Dmitry7
Модератор
*****
Вне Форума


Соберем Серии "НВЖНиТ"!

Сообщений: 5924
Санкт-Петербург
Пол: male
Re: djvused (метаданные)
Ответ #37 - 11.05.2023 :: 12:05:42
 
joker2156 писал(а) 11.05.2023 :: 07:50:33:

Мне лично вообще не удалось найти библио каталогизатора которым хотелось бы пользоваться.

А пробовали эту прогу: All My Books
http://www.thg.ru/software/all_my_books/index.html
https://www.bolidesoft.com/rus/allmybooks.html

Я ее юзаю для личной библиотеки (прога годится не только для бумажных книжек, но и для электронных) , и еще я её приспособил для каталогизации статей из научных журналов, по работе.
Есть возможность добавлять свои поля
Наверх
 

"Если хочешь сделать что-то хорошо, сделай это сам!"
332371574  
IP записан
 
xyz
Гуру
****
Вне Форума


Всем привет!

Сообщений: 890
Re: djvused (метаданные)
Ответ #38 - 11.05.2023 :: 16:38:51
 
AAW писал(а) 11.05.2023 :: 09:32:33:
как-то не в фокусе внимания, что изменение файла книги меняет его хэш, а это ведёт к сложностям при последующем сопоставлении с крупными старыми базами, ЛГ и твирпкс. Теряется однозначность связывания. Там и так частенько по 7-8 версий книги (в ЛГ).

UPD
!! и вот чего сильно хочется, так это md5 в данной библиотеке.



Пришла в голову такая идейка. Сделали книгу, получили хэш. (без меты). Записали его в мету. Потом меняем мету. В ней все равно останется запись, какой был хеш. Если книга была радикально усовершенствована, то можно записать второй хеш после первого. Так и цепочку переделок отследить можно будет.
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5544
Екатеринбург
Пол: male
Re: djvused (метаданные)
Ответ #39 - 11.05.2023 :: 16:43:01
 
удобного графического инструмента нет, метаданные видеть и править. Так, полуподелки некие встречаются.

UPD
Помнится, нигде ничего нет. windjview ext и тот подкачал. Хотя он вьювер, не редактор. Так что программистам на заметку.
Наверх
« Последняя редакция: 11.05.2023 :: 18:26:24 от AAW »  

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
xyz
Гуру
****
Вне Форума


Всем привет!

Сообщений: 890
Re: djvused (метаданные)
Ответ #40 - 12.05.2023 :: 03:47:46
 
Еще одна идейка про хеш.
У нас в каждой книге есть число страниц, их пиксельные размеры, инфа о разрешении, сжатии и числе картинок.
Может, можно изобрести некую сигнатуру, рассчитываемую на основе этой инфы. Тогда будет видно, переделывалась/оптимизировалась книга или нет. Эту сигнатуру и записывать в мета.
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5544
Екатеринбург
Пол: male
Re: djvused (метаданные)
Ответ #41 - 12.05.2023 :: 04:05:39
 
так какая задача решается - ?
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
xyz
Гуру
****
Вне Форума


Всем привет!

Сообщений: 890
Re: djvused (метаданные)
Ответ #42 - 12.05.2023 :: 04:15:54
 
Кто-то тут писал " изменение файла книги меняет его хэш" и это типа проблема. 

Кто бреет брадобрея ? Мета получается должна содержать инфу о самой мета. Изменили мету - изменился хеш, хотя графическая часть не изменилась. ИМХО - возможное решение - это помимо хеша самого файла (битового) иметь другой, независящий от мета, а исключительно от графики.
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5544
Екатеринбург
Пол: male
Re: djvused (метаданные)
Ответ #43 - 12.05.2023 :: 04:21:29
 
Эту тему неплохо обсуждали несколько лет назад на руборде, по поводу нахождения отличий в обработке djvu одной книги. Что можно вскрывать чанки страниц и сравнивать именно их.
Но я-то спрашиваю о самой задаче: зачем вообще нужны метаданные. Тридцать лет прекрасно обходятся без оных. nuget ведь проговорился, что вставка и импорт-экспорт мета в новых джву ему нужна для изучения некоторых программистских концепций.  Не иначе, лавры Кнута покоя не дают.

UPD
AlVaKo прекрасно системно рассмотрел исходные условия - библиотекари/обработчики/читатели. Далее был сделан вывод, что метаданные реально нужны только библиотекарям. Как роли человека, крутящего "в руках" (то есть на ПК/смартфоне/сервере) файл(ы) е-книги.

Обработчику метаданные нужны как справка - кто когда и с какими условиями сделал книгу. Типа, порог Otsu применил Улыбка

Читателю метаданные вроде бы вообще не пригождаются. Ну разве что если список литературы по ГОСТ составляет.
UPD2
Вообще-то точные метаданные полезны при переходе в библиографические и прочие базы. Типа полноценная идентификация автора или УДК/ББК. Но это почти что притянуто за уши. Можно из текста книги всё выудить.

А вот библиотекарю метаданные много зачем нужны. Включая повысить привлекательность (читай - удобство) своей библиотеки.

UPD3
лично для меня изучение этого вопроса было вызвано простой задачей: я не удерживаю в голове полные характеристики всех скачанных/просмотренных книг. Допустим, есть книга "Руслан и Людмила" 1986 года с иллюстрациями Куркина (Палех). Я напрочь не помню, была ли она сделана высококачественно, кем и где её взять в Интернете, именно высококачественную. Приходится скачивать все имеющиеся варианты, предоставляемые библиотеками, и выбирать, просматривая. Это чёртова уйма времени на каждый поиск. Да, лично у меня нет проблем с локальными дисками, поиском по имени-названию, прикидкой объёма файла и ассоциативной памятью кто обработчик и примерно когда делал книгу хорошо. Так я на эту тему 5-10 часов ежедневно кладу, 17 лет. А другому человеку как быть? Меня спрашивают о какой-то теме, я говорю "поищи такого-то автора, он хорош", мне отвечают "да я качал, фуфло везде, неполная и неразборчивая", и опять приходится использовать личные наработки. Это просто неэффективная жизнь. Каждого интересующегося. Поэтому есть настойчивое желание ввести в сетевые библиотеки какой-то признак какую именно версию брать из множества доступных. Метаданные лишь вспомогательный инструмент для поиска в указанном аспекте, лично для меня. Стандартные поисковые характеристики типа автора года и названия и так, без меты, в имя можно внести. А вот как облегчить обществу доступ к наилучшему варианту - это вопрос. Поэтому я приветствую гиперссылку "сделано Benoni" на титульнике Улыбка
Наверх
« Последняя редакция: 12.05.2023 :: 07:45:35 от AAW »  

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
joker2156
Активист
***
Вне Форума



Сообщений: 305
Re: djvused (метаданные)
Ответ #44 - 12.05.2023 :: 08:53:44
 
Dmitry7 писал(а) 11.05.2023 :: 12:05:42:
А пробовали эту прогу: All My Books

Мне кажется видел, но не уверен, посмотрю на досуге, спасибо.
Наверх
 
 
IP записан
 
nuget
Новичок
*
Вне Форума


Всем привет!

Сообщений: 21
Re: djvused (метаданные)
Ответ #45 - 12.05.2023 :: 10:25:27
 
xyz писал(а) 12.05.2023 :: 03:47:46:
Может, можно изобрести некую сигнатуру, рассчитываемую на основе этой инфы. Тогда будет видно, переделывалась/оптимизировалась книга или нет.

Всё намного проще. Достаточно определить пользовательские поля, например,

Поля специфические для сканированных книг (общие)
-- djvucreator: программа, в которой был создан DJVU-файл (например, SK).
-- scancreator: программа, которая использовалась для создания сканов.
-- scaneditor: по аналогии с полем editor, но имеет отношение к редактору исходных сканов.
-- scanowner: тот кто сканировал книги и предоставил исходный материал для создания DJVU.
-- djvudate: дата создания DJVU-файла.

Поля для определения текущей редакции
-- djvuedition: номер или дата текущей версии (в некоторых дистрибутивах Linux практикуется запись новой версии в формате даты, например 20230512-1. суффикс может отражать специфику редакции).
-- djvulastmodified: дата последнего изменения DJVU (не обязательно, если записывать поле djvuedition в формате даты).

По этим полям можно проследить историю изменений... Улыбка
Наверх
« Последняя редакция: 12.05.2023 :: 10:56:41 от nuget »  
 
IP записан
 
zvezdochiot
Постоялец
**
Вне Форума



Сообщений: 159
Москва
Пол: male
Re: djvused (метаданные)
Ответ #46 - 12.05.2023 :: 11:00:27
 
nuget писал(а) 12.05.2023 :: 10:25:27:
djvucreator, scancreator, scaneditor, scanowner, djvudate, djvuedition, djvulastmodified
... По этим полям можно проследить историю изменений... Улыбка

Таким точно будут заниматься только "избранные персонажи". Абсолютно бесполезная инфа. А уж "история изменений" - это вообще перебор. Может стоит делать сразу и делать так, чтобы не переделывать?

Наверх
 

Keep it simple, stupid
WWW  
IP записан
 
nuget
Новичок
*
Вне Форума


Всем привет!

Сообщений: 21
Re: djvused (метаданные)
Ответ #47 - 12.05.2023 :: 11:22:26
 
zvezdochiot писал(а) 12.05.2023 :: 11:00:27:
А уж "история изменений" - это вообще перебор. Может стоит делать сразу и делать так, чтобы не переделывать?

"я бы взял частями, но мне нужно сразу" -- Остап Бендер ... Улыбка

Суть вопроса: как проследить историю изменений по MD5 в публичных библиотеках (например, Libgen)?
Варианты:
-- по косвенным признакам цифровой подписи (метаданные встроенные в DJVU);
-- дополнительная информация в описании загружаемого файла в Libgen (где нужно указать ссылку на предыдущую версию, загруженную в хранилище).

Что проще?
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5544
Екатеринбург
Пол: male
Re: djvused (метаданные)
Ответ #48 - 12.05.2023 :: 11:37:03
 
Ничего вы не отследите, поскольку версионность НИКТО не хранит. Даже ЛГ начал удалять файлы.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
Lykas
Патриарх
*****
Вне Форума


Всем привет!

Сообщений: 1124
Re: djvused (метаданные)
Ответ #49 - 12.05.2023 :: 11:47:20
 
xyz писал(а) 12.05.2023 :: 03:47:46:
Еще одна идейка про хеш.
У нас в каждой книге есть число страниц, их пиксельные размеры, инфа о разрешении, сжатии и числе картинок.
Может, можно изобрести некую сигнатуру, рассчитываемую на основе этой инфы. Тогда будет видно, переделывалась/оптимизировалась книга или нет. Эту сигнатуру и записывать в мета.

Можно сделать проще - записывать в мету время создания файла. И потом сравнивать время создания из меты и файла.
Наверх
 
 
IP записан
 
zvezdochiot
Постоялец
**
Вне Форума



Сообщений: 159
Москва
Пол: male
Re: djvused (метаданные)
Ответ #50 - 12.05.2023 :: 12:38:24
 
nuget писал(а) 12.05.2023 :: 11:22:26:
Суть вопроса: как проследить историю изменений

Никакой "сути" не вижу.
Как "это" поднимет качество библиотек и отдельных книг?
Никак!
А по отдельным книгам есть вероятность падения. (можно же потом доделать. когда это "потом"? хз).

В ваших устремлениях нет вероятности достижения реальных целей. Лишь бурная имитация деятельности. Не более чем "пустые" коммиты. И будут определять "качество" книги длиной истории, а по факту всё будет совсем "не так".

Наверх
 

Keep it simple, stupid
WWW  
IP записан
 
Dmitry7
Модератор
*****
Вне Форума


Соберем Серии "НВЖНиТ"!

Сообщений: 5924
Санкт-Петербург
Пол: male
Re: djvused (метаданные)
Ответ #51 - 12.05.2023 :: 14:08:01
 
nuget писал(а) 12.05.2023 :: 10:25:27:
-- scanowner: тот кто сканировал книги и предоставил исходный материал для создания DJVU.


вот только этого не надо.
мало кто захочет светиться в качестве сканировщика-обработчика
Наверх
 

"Если хочешь сделать что-то хорошо, сделай это сам!"
332371574  
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5544
Екатеринбург
Пол: male
Re: djvused (метаданные)
Ответ #52 - 12.05.2023 :: 15:38:43
 
Dmitry7 писал(а) 12.05.2023 :: 14:08:01:
вот только этого не надо.
мало кто захочет...

иначе Россия не выживет в условиях вечного противостояния с Западом. Я серьёзно. Нам всем придётся "выйти из тени". Так же и авторское право придётся отменять/изменять в части сроков и материальных ограничений. Это, по моему мнению, вопрос максимум полутора лет.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
Lykas
Патриарх
*****
Вне Форума


Всем привет!

Сообщений: 1124
Re: djvused (метаданные)
Ответ #53 - 12.05.2023 :: 19:34:22
 
zvezdochiot писал(а) 12.05.2023 :: 12:38:24:
Никакой "сути" не вижу.
Как "это" поднимет качество библиотек и отдельных книг?
Никак!
А по отдельным книгам есть вероятность падения. (можно же потом доделать. когда это "потом"? хз).

В ваших устремлениях нет вероятности достижения реальных целей. Лишь бурная имитация деятельности. Не более чем "пустые" коммиты. И будут определять "качество" книги длиной истории, а по факту всё будет совсем "не так".

Реальных целей для кого? Каждый идет в свою сторону. И достаточные для одного не будут достаточные для другого. Опять же все сходится к одному - соотношению время\качество. Вы можете потратить пару-тройку лет на фактический перенабор изданной бумажной книги. Можете прямо в программе сканирования создать гигабайтный  PDF. Понятно что это крайности. Но такова жизнь.
ЗЫ надо засечь, сколько уходит времени на то что-бы прошел весь цикл, от сканирования до получения Djvu.
ЗЫ2 проблема не отсканировать, проблема обработать.
Наверх
« Последняя редакция: 12.05.2023 :: 19:48:01 от Lykas »  
 
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5544
Екатеринбург
Пол: male
Re: djvused (метаданные)
Ответ #54 - 12.05.2023 :: 19:40:45
 
Lykas писал(а) 12.05.2023 :: 19:34:22:
ЗЫ надо засечь, сколько уходит времени на то что-бы прошел весь цикл, от сканирования до получения Djvu.
ЗЫ2 проблема не отсканировать, проблема обработать.

ЗЫ - От пяти часов. До месяца, если часа по два в день выделять.

ЗЫ2 - Разве это "проблема"? По-моему, когда человек не хочет обработать на отлично, ему вообще не стоит этим заниматься. Потому что если копнуть такую психику поглубже, можно будет увидеть очень неприятные причины такого поведения. И незачем их обострять повторением.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
Lykas
Патриарх
*****
Вне Форума


Всем привет!

Сообщений: 1124
Re: djvused (метаданные)
Ответ #55 - 12.05.2023 :: 20:04:30
 
AAW писал(а) 12.05.2023 :: 19:40:45:
ЗЫ2 - Разве это "проблема"? По-моему, когда человек не хочет обработать на отлично, ему вообще не стоит этим заниматься. Потому что если копнуть такую психику поглубже, можно будет увидеть очень неприятные причины такого поведения. И незачем их обострять повторением.

Повторюсь. "Отлично" и "Достаточно" - у каждого свое...
Для меня так достаточно для книг - порезать страницы в Тейлоре,  отсепарировать, текст - черный, картинки - к картинкам. На картинках можно фон убрать. Djvu imager сжать. И все. Хоть я "тыжинженер", но в Кромсаторе не пошло. Ну еще могу в Пайнте печати убрать вместе с пятнами от варенья, или если уж при сканировании рука дернулась. Текст\картинки в 600dpi.
Для газет\журналов (там где много работы) еще проще - порезал, высветлил от фона, перегнал в JPG 60% 300 DPI, сжал в PDF.
Наверх
 
 
IP записан
 
AlVaKo
Гуру
****
Вне Форума



Сообщений: 562
Алма-Ата
Пол: male
Re: djvused (метаданные)
Ответ #56 - 12.05.2023 :: 20:17:52
 
Lykas писал(а) 12.05.2023 :: 19:34:22:
ЗЫ надо засечь, сколько уходит времени на то что-бы прошел весь цикл, от сканирования до получения Djvu.
ЗЫ2 проблема не отсканировать, проблема обработать.


Нижняя временая планка.
Сканирование  - страницы А5, серые (не цветные) , 600 dpi - 100 страниц в час.
Пакетная обработка - Старый комп. Страницы  без фото-иллюстраций. С просмотром результата для всех страниц. Без ручной очистки мусора. 100 страниц  - 1,5 часа.
Получаем "голый" djvu.

Время, на ручную очистку и правку букв, сильно зависит от качества печати.
Наверх
 

Сложно отбинаризировать черную перемычку на белой бумаге, особенно если её там нет.
 
IP записан
 
nuget
Новичок
*
Вне Форума


Всем привет!

Сообщений: 21
Re: djvused (метаданные)
Ответ #57 - 13.05.2023 :: 00:19:39
 
Dmitry7 писал(а) 12.05.2023 :: 14:08:01:
вот только этого не надо.
мало кто захочет светиться в качестве сканировщика-обработчика

я имел ввиду использовать ник с форума, то что и так уже известно... Улыбка
Наверх
 
 
IP записан
 
nuget
Новичок
*
Вне Форума


Всем привет!

Сообщений: 21
Re: djvused (метаданные)
Ответ #58 - 13.05.2023 :: 00:43:38
 
zvezdochiot писал(а) 12.05.2023 :: 12:38:24:
Как "это" поднимет качество библиотек и отдельных книг?

проследить историю изменений и качество книг, немного разные задачи... однако, не имея цифровой подписи, не будет даже предмета исследования... например, невозможно определить в какой программе выполнялась обработка, версия программы и т.д... но сложив все косвенные признаки во едино, можно, хотя бы, получить некоторую статистику... например, какая программа для обработки используется чаще, SK или ST?!...
Наверх
« Последняя редакция: 13.05.2023 :: 00:50:06 от nuget »  
 
IP записан
 
joker2156
Активист
***
Вне Форума



Сообщений: 305
Re: djvused (метаданные)
Ответ #59 - 13.05.2023 :: 04:46:23
 
AAW писал(а) 12.05.2023 :: 15:38:43:
Нам всем придётся "выйти из тени".

А смысл? Верите, что в какой-то момент прозвучит "Алексей, мы знаем что вы много сканировали книг, Родина вами гордится, вот вам яхта"? Меня терзают смутные сомнения(с)..
Наверх
 
 
IP записан
 
Страниц: 1 2 3 4 
Послать Тему Печать