Ну вот, конечно, это авторские права мешают людям книги нормально делать и в инет выкладывать.
Цитата:Что важнее массовость изготовления электронных книг или некие установленные критерии их изготовления?
Чёткие критерии являются залогом массовости.
Массовость - это разделение труда и конвейерные принципы обработки.
Массовость - это поток :
сырые сканы ->
простая обрезка с запаковкой в pdf ->
разделение текст/картинки с джвуированием - >
чистка мусора с глифированием - >
OCR с вычиткой, гиперссылки.
Разделение труда предполагает, что разные люди делают разные операции. У кого что лучше получается.
Чтобы они могли взаимодействовать друг с другом должны быть некие стандарты на промежуточные и итоговые результаты.
Мы видим это на архив.орге с их родными сканами (а не теми, что туда всякие идиоты понапихали). И фотосканы есть, и пдф и джву. Так себе джву. Но в случае необходимости, их сырые фотосканы можно вылизать до приемлемого состояния.
Похожий принцип мы видим на рутрекре с видео:
BDRemux -> BDrip -> mp4 1000p - > mkv DVO -+ MVO, MKV (Rus, Eng) + Sub
сырой видеопоток (захват) - сжатый - сжатый в определенном размере - наложен дубляж - вместо одноголосого перевода добавлена полноценная многоголосая озвучка - наложены субтитры.
Там на самом деле несколько сложнее, так как цепочка может быть нелинейной. Могут появляться новые исходники, типа "режиссерская версия" или "Open Matte" (кадр с большим наполнением).
Совершенно не все книжки заслуживают возни по месяцу с каждой. Если их все по максимальным стандартам делать, то книг в инете вообще не будет. Критерии выбора с чем возиться - несколько субъективны, зависят от предпочтений в чтении обработчиков, хотя некий круг чтения, некое ядро библиотеки в целом просматривается (научпоп, школьное образование, классические учебники институтского образования, детская литература, домашнее хозяйство, справочники, хорошо иллюстрированные книги).
Главное, чтобы книгу всегда можно было доработать после быстрого первичного прохода в случае, если она реально нужна.
Но нет, карты какие-нибудь вместо 600 дпи посканили на 300 (или вообще отфоткали), потом через джву с автосегментированием прогнали и вуаля. Считайте в инете книги и нет.
Иногда выкладывают толстый пдф, и джву, так что из пдф можно сделать непорченный джву. Но часто кладут только джву, или пдф "оптимизируют". И всё. Амба.
Сканируешь для других ? А) Поскань в 600. Б) Либо обеспечь полное прижатие, либо использую оптикбук, либо расшей книжку.
Особенно, если это какой-то редкий материал.
Не хочешь возиться с СК при обработке ? Прекрасно. Обрежь всё и запакуй цветными картинками в пдф. Можно в параллель сделать плохой джву. Тот, кого бесит ужирнение букв, сможет из пдф-ки соорудить альтернативу.
Но нет. Надо всё ужать и запороть. Сканы удалить. А про сделанную нестандартную хрень кричать на всех форумах, какая она крутая. И поскольку довольно-таки часто обработчик был сам себе и сканировщик то "как он видит", так все читать и будут.
Можно своих штампов от души наляпать:
https://geoportal.rgo.ru/catalog/atlasy-mira/bolshoy-sovetskiy-atlas-mira-i-ukaz...Гос. Библиотеки кладут и фотосканы и пдфки в джипегах. И нормально. И не жалуются, что места не хватает.
Проблемы возникают, когда они джипеги пережмут или зачем-то, неумеючи, начнут над картинками изгаляться.
То есть сделают нестандарт.
Чтобы файлик на каждой стадии можно было подхватить и дальше крутить, он должен отвечать определенным критериям.
А вот порченное выкладывать не нужно, когда исходников нет.
Уж лучше гиг исходников на рутрекре раздавать, чем поганый джву выкладывать.
Однако, нет, каждый сам себе кустарь-одиночка с мотором.
Скоты просто.