Я выкачал 188 версий томиков Гранат с сайта РГБ и распихал их по 77 папкам с номерами томов. В некоторых по 6 версий томика, в некоторых по одной. Но все папки заполнены, тут РГБ молодцы. Больше 50 Gb.
Однако далее я недоумеваю. У меня больше вопросов, чем ответов,
1. Качество многих ниже плинтуса. Я-то думал государственная библиотека на хорошем профессиональном сканере (а у них есть, я знаю) сделала толстые референсные версии известной энциклопедии (у них там, например, есть томик на 1 гигабайт), которые можно по единой схеме более-менее быстро оцифровать. Но нет:
- некоторые пережаты
- некоторые только ч/б (т.е. испорчены иллюстрации)
- некоторые без обложек и форзацев.
То есть обработка каждого томика - это будет самостоятельная история, нестандартная и довольно длинная.
Почти в каждой папке есть версия, из которой можно что-то выжать. Но не везде.
И гробить до фига времени на изготовление версии, которую я лично сочту приемлемой, а "местные сторожилы" (как в анекдоте:
ты сторожила ? вот и сторожи !) будут плеваться, неохота.
Поскольку некоторые томики (пока) годного исходного материала не имеют, изготовить хороший полный комплект по-любому не получится.
То есть самый первый напрашивающийся вариант: оставить всё как есть. Пусть будет 77 папок, в них сложено по куче версий имеющегося, а там видно будет. В случае необходимости инфу можно найти. Но ЧИТАТЬ то, что там есть, лично мне неприятно.
А ведь ценность-то Гранат в том, что её живым языком писали и её (до сих пор) именно читать интересно.
2. Вместе с тем, тех томиков, с которыми полная беда, вроде, не так и много. К тому же их можно попробовать пересканировать. К части чисто ч/б томиков я могу раздобыть картинки.
Можно сделать более менее стандартную штуку, когда в хорошую читаемую ч/б версию томика вкливаются цветные картинки из пережатой жипеговой, которую бинаризовать невозможно. Т.е. (пример условный) текст берется из 11 стереотипного, а рисунки из 13 стереотипного издания.
3. В торрент-раздаче (которая вроде как вся с РГБ) 33 файла совпадают с имеющимися на сайте РГБ, а 23 - нет. Это на самом деле хорошо, так как некоторые из этих 23 файлов - это более толстые версии (а не пережатые джипегом пдф-ка с сайта). Некоторые - вообще представляют другой скан (уголки не замяты) !!!! того же самого экземпляра РГБ и при этом его нет на сайте РГБ !! Почему ???
У меня есть подозрение, что в какой-то момент выложенное на сайте попортилось, либо выложено было не всё. У меня также есть ощущение того, что с некоторых более толстых пдф-ок когда-то делались ч/б оцифровки и по закромам даже можно эти оцифровки найти. То есть можно ловить по старым копиям раздач (выкачиваю сейчас джипеги с архив-орга) либо толстые сканы, либо ч\б версии, изготовленные ранее с более толстых сканов, а потом в них вклеивать рисунки.
Но всё равно. Когда они испортились ??? Или у РГБ в загашниках есть ещё сканы ????
4. Несмотря на то, что раздача на рутрекере загибается (торрент не обновляют, хотя юзеры в комментариях отсутствующие тома и выкладывают, причем некоторые даже свои собственные, а не РГБ-сканы !!!), по интернету, оказывается, уже какие-то более-менее стандартные комплекты разбежались:
Ч.б варианты:https://ru.wikipedia.org/wiki/%D0%AD%D0%BD%D1%86%D0%B8%D0%BA%D0%BB%D0%BE%D0%BF%D...РГБ-версииhttps://ru.wikisource.org/wiki/%D0%AD%D0%BD%D1%86%D0%B8%D0%BA%D0%BB%D0%BE%D0%BF%...Ну и зачем плодить новые сущности ? Если всех всё устраивает ?
5. В Энциклопедии ГРАНАТ, оказывается, были дополнительные листки. В некоторые томики их вклеивали. Поэтому та еще головная боль: искать эти листки. Каталога листков, судя по всему, в природе не существует.
В томе 27 также, встречаем:
Настоящий том, первоначально вышедший в 1915 году, печатается повторно, в общем без изменений, по матрицам. Но при этом о „Ленине и ленинизме" даны статьи И. В. Сталина о Ленине и его лекции „Об основах ленинизма". Текст их просмотрен для помещения в Словаре.то есть надо как-то прицепливать вкладку с разными версиями страниц (тут надо томики сличить).
6. Я не знаю, как делать переплеты, корешки и форзацы. Томики выпускались по разному: в полукожаном, матерчатом и картонажном переплетах. С форзацами и без. В каких-то экземплярах утраты и неродные крышки переплетов. Обложки у гранатов неинформативные. Самый красивый - это корешок (хотя я их и не люблю).
То есть я не хочу такие обложки
http://www.alib.photo/gallery/wodniw/15261458258185.JPGа хочу вот такие:
http://alib.photo/gallery/eidos/15029825812490.JPGНо как раздобыть 77 идеальных корешков я не представляю. У меня есть идея: разыскать один приличный вариант и перевести в вектор, а текст потом везде вписать, подобрав шрифт, или отвекторизовав только текст с плохого экземпляра (и расположить его поверх чужого красивого корешка).
Это же всё равно, если делать, будет не родной вариант, а сборная солянка, в которой будут собраны куски разных версий издания. А так, такая самопальная обложка будет указывать: что это версия не из библиотеки, а соструганная.
Но ведь у них же ещё и разная толщина была:
https://yadi.sk/d/Ey9QR8Uz3V9eBC/222/02082018/20180801_203306.jpgВ принципе, векторную версию корешка можно будет сжимать и растягивать, подстраиваясь под шрифт. Можно все сделать одинаковыми.
Можно сделать наложение на родной переплёт.
Что касается форзаца и 1 листа.
Форзац надо либо давать на A3 не разрезая:
http://alib.photo/gallery/s6476701/15229530274967.JPGлибо взять только одну из половинок. Две одинаковых половинки подряд -это плохо.
Поскольку сейчас скана такого неразрезанного форзаца нет (и в доступе хорошей версии нет), то напрашивается вариант из одной половинки.
Также мне кажется правильным, выбрать из 188 РГБ версий самый красивый вариант первого листа (не знаю, как правильно называется вкладка перед титулом) и вклеить одинаково во все версии, неважно, был он в оригинальном томике или нет.
http://alib.photo/gallery/s6476701/15229420628851.JPGНапоминаю, томики издавались очень по разному. Было не менее 13 стереотипных изданий (допечаток); было минимум три версии переплетов:
https://img-fotki.yandex.ru/get/896349/130341028.20c/0_20bd97_52b150ae_XXLТо есть изготовить один стандартный комплект:
- векторный корешок + кожаная обложка
- A3 форзац
- лист перед титулом
- задний лист перед нахзацем
- A3 нахзац
-задняя кожаная обложка
и ко всем приклеить.
Альтернативный вариант :
Поскольку обложки пустые неинформативные, без текста, то их смело можно выкинуть и пусть каждый томик стартует с титульного листа, где есть его номер и название.
Ведь их же так и издавали: без переплета - цена 3 рубля; с переплетом 3.50.
7. Если решить проблему обложки, далее можно определить пиксельный размер, в котором книжка должна быть. И постепенно томик, за томиком по мере возможностей ... переводя их после обработки в размер выбранного холста.
Но все равно 77 нестандартных томов в порядок приводить ... бррр.
Я мог бы, допустим, попробовать один на пробу сделать, чтобы понять: стоит или не стоит вообще этим заниматься.
Но меня всё равно сильно напрягает пункт первый: отсутствие годного сырья для отдельных томов.