OCR форумы Добро пожаловать, Гость. Пожалуйста, выберите Вход или Регистрация
Всем привет!
Hi all!
 
  ГлавнаяСправкаПоискВходРегистрация Администратор Библиотека  
 
Страниц: 1 2 3 
Послать Тему Печать
О форме электронных книг в DJVU (Прочитано 66777 раз)
Minor
Активист
***
Вне Форума


Бывший участник

Сообщений: 278
Петербург
Пол: male
О форме электронных книг в DJVU
18.04.2006 :: 09:24:28
 
Fwd: легенда большая, а тема важная. Хорошо бы, чтоб хотя бы на первый вопрос ответили ВСЕ. Сбросьте страничку и  
прочитайте не торопясь, когда будет время, а при следующем заходе на форум, обязательно ОТВЕТЬТЕ. В противном случае
я и другие заинтересованные лица будут думать, что все это не важно и можно делать как угодно (точнее, половину  
не делать вообще).

1. Главный вопрос: что приоритетнее - обложка вначале или синхронная нумерация страниц? Для большинства книг - это
альтернатива, не допускающая компромисса. О целесообразности введения в файл обложки речь, вроде, сейчас не идет, хоть
это и ощутимо увеличивает его размер. Одного взгляда достаточно, чтобы узнать "с детства знакомую книгу" или просто
знакомую или, что это как раз то издание. Вот стоит ли помещать заднюю страничку обложки, если на ней кроме  
"Цена 30 коп." нет больше никакой информации - это тоже вопрос... И конечно, красиво, если книжка всегда открывается
обложкой. Сразу определенный настрой создается... Однако, при этом, как правило (за исключением случаев, когда первая
страница пуста или содержит несущественную информацию - логотип издательства, например), нумерация страниц в DJVU/PDF-
файле и в оригинале перстают соответствовать друг другу. Это сильно затрудняет пользование книгой собственно в  
электронном виде: нельзя пользоваться оглавлением и ссылками на другие страницы по тексту. Неудобно, точнее.
Гиперссылки и поиск по тексту облегчают, конечно, навигацию, но их пока мало кто делает. Обычно, в пользу безусловного
помещения обложки (а также задней страницы обложки (а также их пустых внутренних сторон)) в начало файла приводятся
следующие аргументы: красиво, единообразно (очень важный аргумент - мне он долго голову сверлил), создается полное
ощущение книги в руках и главный - удобство распечатки. В том смысле, что при распечатке буклетом (например,  
в программе FinePrint) не нужно никаких премудростей. Это, конечно, верно, но только для небольших брошюр (до 100 с.).
При печати же более-менее объемных книг гораздо удобнее делать это буклетами, соответствующими буклетам книги (обычно
это 16 (в хороших или старых) или 32 страницы. Каждый буклет - отдельный акт печати (большие буклеты трудно печатать
еще и по тех.причинам - большинство принтеров при печати обратной стороны хоть одну страничку, да пропустят - буклет
испорчен). Степени двойки у большинства из нас прочно сидят в голове и ошибиться трудно (32, 64, 96, 128 ...). А вот  
если нумерация сдвинута, каждый раз приходится высчитывать - если буклетов много, ошибки очень часты. При синхронной
страничности обложку можно напечатать отдельно буклетом же (на единственном листе). При этом пустые внутренние стороны  
обложки окажутся на другой стороне листа и все будет как надо. То же и со вклейками. И на другой бумаге можно, и в  
цвете...  
Я однозначно считаю, что синхронизацию надо сохранять безусловно. Обложку помещать вперед по возможности. Заднюю  
страницу в файл не помещать (как и их пустые обратные стороны - на них, кстати, DJVU Solo ругается). Если положение  
цветных вкладок не произвольно (содержат текст статьи или иллюстрации, привязанные к тексту; как в разделе "Радио -  
начинающим" в журнале "Радио", например), вкладки все равно перемещаются в конец файла, а на прилежащих к ним страницах
делаются видимые гиперссылки на них. На самих вкладках должны быть обратные гиперссылки. Это не так сложно - несколько  
секунд на одну страницу-вкладку. Гиперссылки при печати не выводятся и факсимиле не портится.
Некоторые оцифровщики, если в постраничном скане встречаются таблицы "на разворот", в таком виде и помещают их в файл.
Что тоже приводит и к нарушению синхронизации и к проблемам при печати. Такие таблицы (а также схемы и рисунки)
желательно ДУБЛИРОВАТЬ в конец файла (желательно с возвратными ссылками).
Если кому кажется, что все это очевидно, могу заметить, что большинство DJVU-истов на форуме, как я понял,  
придерживаются прямо противоположной концепции: приоритет обложки. Поэтому, еще раз прошу, обязательно выскажитесь
хотя бы по этому вопросу. Важно ведь!

2. Поля. Я считаю, что поля (их размеры и соотношение ширин) должны соответствовать полям оригинала. Тогда при  
распечатке мы получаем факсимильную копию книги. Вопросу соотношения ширин правого и левого полей в полиграфии  
придается большое значение. Есть несколько основных схем, но все они предполагают неравенство внутреннего и внешнего
полей. Альтернативы: равные правое и левое поля; совсем без полей. Аргумент в пользу равных полей - текстовый блок
не бегает при листании в браузере. Серьезных аргументов в пользу отсутствия полей я не знаю (лень чистить?), но делают
их многие. На мой взгляд, поля очень сильно влияют на восприятие текста - я испытываю большие неудобства, читая книги  
без них...

3. Текстовый слой и гиперссылки. Текстовый слой, на мой взгляд, нужно добавлять безусловно, хоть это и ведет к
некоторому увеличению объема (примерно, как от введения половины задней страницы обложки  ). И добавить, ведь, теперь
не трудно (если не очень привередничать - одна галочка в DEE). И удобств куча: можно копировать текст, контекстный  
поиск, причем (с дополнительным бесплатным плагином) и системный (стандартный WINDOWS-ный поиск по всей DJVU-библиотеке
- это ж круто; и быстро, кстати - быстрее, чем в массиве WORDовских документов). Не добавляют и всё. Почему?
О целесообразности гиперссылок (скажем, переход из оглавления к соответствующей странице) вопрос не стоит. Места они
дополнительного не занимают. Каждый DJVU-ист сам решает, тратить на них время и труд или нет. На мой взгляд, в научной
и учебной литературе они необходимы (особенно межстраничные ссылки). Вопрос в другом: нужно ли выделять их цветом, или
негативом, или вообще как-то выделять? Очень трудно сделать красиво, если выделять. Обычно, получается не. С другой  
стороны в этом случае при открытии файла непонятно, есть они или нет. Нужно пробовать (хотя бы на оглавлении - если  
есть, то уж в оглавлении обязательно). Может, стоит сообщать об их наличии в начале файла явно (наличие текстового слоя  
индицирует активный бинокль поиска)?  
Я склоняюсь к тому, чтоб их никак не выделять - оставлять невидимыми, чтоб тем,
кому не нужно, глаза не мозолили, а куда щелкать - человек быстро осваивается, особенно если делать их вплотную друг к
другу.

4. Клише (растровые изображения). В смысле, насколько важна передача клише бинарно. Большинство клише вполне сносно
передаются бинарно на300 dpi. На 600 dpi можно безусловно передать бинарно любое типографское клише. Почему-то многие
оцифровщики передают его, а то и всю страницу, полутоном. Зачем? Конечно, полутоном, даже с 16-ю градациями, клише
смотрится немного лучше, но DJVU-кодер все равно потом превращает все в кашу серых пятен (если не использовать режим
photo; но в этом случае у DJVU нет практически никаких преимуществ перед PDF). Трудоемкость снятия полутоном, особенно,
если только клише, а текст бинарно, не ниже, а в последнем случае ощитимо выше, чем даже если страницу отсканировать
дважды с оптимальными для текста и клише параметрами и вставить потом содержимое одной страницы в другую. Если  
страницы с клише целиком выполняются в полутоне, вид документа совсем безобразен, на мой взгляд, особенно при даже
небольшом увеличении (по ширине страницы, например).
Я за безусловно бинарную (в конечном DJVU-файле) передачу клише - как в оригинале.

Рекомендуемый вариант ответа:"По всем пунктам целиком и полностью согласен с Minorом"  
Наверх
« Последняя редакция: 14.01.2012 :: 21:55:31 от Dmitry7 »  
 
IP записан
 
Gautier
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 154
Re: О форме электронных книг в DJVU
Ответ #1 - 18.04.2006 :: 13:09:12
 
1. Насчет приоритета синхронизации номеров страниц в книжном оригинале и файле DJVU за счет переноса обложки и прочего в конец.
Не могу согласиться. По моему мнению, если уж версия выполнена в DJVU, то она должна быть полностью аутентична книге, даже со всеми обложками и пустыми страницами. А иначе за что боролись? Так, я в том многострадальном Ферде при очистке текста в граф. виде иной раз вижу опечатки, но их не исправляю.
Другое дело, если версию в DJVU кто-то может использовать для работы, а не только для чтения или распечатки. Я имею в виду, что кто-то с нее чего-то сможет взять из текста, хотя как это можно сделать, я не знаю. Наверное, так и имеет место со всеми вашими радио, но как это технически – не понимаю.
Насчет аутентичности версии DJVU книге меня навели работы Ершова – именно у него так, со всеми пустыми страничками вначале. Когда я это увидел, то и решил, что, вероятно, так наиболее правильно.
Асинхронизация же номеров страниц в DJVU, по-моему, вещь маловажная. А если она важна (для техн. текстов), то никакие обложки там не нужны, и аутентичность тоже.
2. Трудно полностью соблюсти оригинальные поля, поскольку часто при сканировании текст отображается неровно, его приходится поворачивать, причем видимые поля нарушаются и их трудно восстановить в исходном виде.
По моему теперешнему мнению, в наилучшем варианте – поля одинаковые по всем сторонам. Их надо делать самому в Photoshop, например (затруднительно, конечно, когда много страниц). А совсем без полей, конечно, восприятие плохое, это верно.
3. Про остальное сказать ничего не способен, ибо тут профан.
Наверх
 
 
IP записан
 
Вадим
Администратор
*****
Вне Форума


Всем привет!

Сообщений: 1072
Россия
Пол: male
Re: О форме электронных книг в DJVU
Ответ #2 - 18.04.2006 :: 23:27:47
 
1. По этому поводу я уже высказывался. Моя позиция не изменилась. Книгу надо делать такой, как она выглядит в бумаге...
Проблему с нумерацией страниц должны решить программисты. Т.е. задавать, с какой страницы должна начинаться нумерация страниц должен создатель файла в редакторе. Этого пока еще нигде не предусмотрено, к сожалению.
2. Поля, мне кажется, нужны. А вот какой размер? Есть стандарты для бумажных книг?
Я пока делаю равные и чтобы приблизительно (на глаз) соответствовали бумажному варианту. Журналы обрезаю на глаз в Фотошопе (там поля разные), а книги пропускаю через СканКромсатор.
3. Если делать журнал - то конечно цветное. Если книга с бинарными рисунками - то бинарное (ради экономии места), а обложки, форзацы, фронтисписы и пр. иллюстрации (о структуре книги см. здесь: http://publ.lib.ru/HELP/_faq.html ) сканируются отдельно в цвете или полутоне и DJVUируются в режиме Фото. Если книга или брошюра с большим количеством полутоновых фоток - то, наверно, в полутоне. А как иначе правильно передать полутон?

P.S. Недавно писал Генчо по поводу новой версии его утилиты DjvuOCR. Он уверяет, что утилита уже готова и остались кое-какие мелочи. Обсуждать будем здесь. Что в ней нового пока не знаю, но она уже будет работать и с файлами ФайнРидер 8.0. Это значит, что качество прикрепляемого OCR повысится.

Радуйтесь, поклонники СканКромсатора! Автор на мой вопрос о новой версии этой программы ответил: "Планирую выпустить на этой неделе".
Хорошо бы ее тоже здесь обсудить...
Наверх
 
WWW  
IP записан
 
Minor
Активист
***
Вне Форума


Бывший участник

Сообщений: 278
Петербург
Пол: male
Re: О форме электронных книг в DJVU
Ответ #3 - 19.04.2006 :: 00:52:44
 
Вадим писал(а) 18.04.2006 :: 23:27:47:
А как иначе правильно передать полутон?


Вот так, например (см. прицеп; для того, чтобы увидеть реальный TIFF, нужно смотреть при увеличении 600%, поскольку 600dpi). Вообще говоря у меня нигде нет полутона - в радиоежегодниках, например.
Изображение чисто бинарное. Черные точки клише на белом фоне. Откуда взялась мысль о передаче клише полутоном, ума не приложу. Полутон - для отсканированных реальных бумажных черно-белых фотографий - и только. В книгах полутона не бывает в принципе.

Вадим писал(а) 18.04.2006 :: 23:27:47:
3. Если делать журнал - то конечно цветное. Если книга с бинарными рисунками - то бинарное (ради экономии места), а обложки, форзацы, фронтисписы и пр. иллюстрации (о структуре книги см. здесь: http://publ.lib.ru/HELP/_faq.html ) сканируются отдельно в цвете или полутоне и DJVUируются в режиме Фото. Если книга или брошюра с большим количеством полутоновых фоток - то, наверно, в полутоне.


Вадим, помилуйте! Там же (в 3-м пункте) про цвет гиперссылок! Вот и Вы уже не читаете... Много, конечно, текста и плотный он - не могу я воду лить. Пишу как для нормальных технарей, привычных читать безводные руководства. Вот и моё то же самое ожидает.
Наверх
« Последняя редакция: 19.04.2006 :: 18:41:41 от Minor »  

borodin1.rar (Вложенный файл удален)
 
IP записан
 
Вадим
Администратор
*****
Вне Форума


Всем привет!

Сообщений: 1072
Россия
Пол: male
Re: О форме электронных книг в DJVU
Ответ #4 - 19.04.2006 :: 23:00:54
 
Да, с третьим пунктом я что-то напутал. Это про четвертый.
Гиперссылок я в файлах DJVU не делаю и делать пока не собираюсь.

Что касается полутона. Я еще раз говорю - руководство нужно. Я сталкиваюсь с реальными файлами. Там бинарные полутоновые изображения выглядят плохо. Часто просто трудно понять что на них изображено. Вроде все понятно - изображение передано точками. Но в книге это выглядит великолепно, а в файлах, в лучшем случае, посредственно.
Наверх
 
WWW  
IP записан
 
Minor
Активист
***
Вне Форума


Бывший участник

Сообщений: 278
Петербург
Пол: male
Re: О форме электронных книг в DJVU
Ответ #5 - 20.04.2006 :: 00:03:18
 
Вадим писал(а) 19.04.2006 :: 23:00:54:
Я сталкиваюсь с реальными файлами. Там бинарные полутоновые изображения выглядят плохо. Часто просто трудно понять что на них изображено.


Ага, понятно. Действительно, бывает на 300dpi.

Но, ведь, вот в ВПР 46 у Вас уже все клише бинарное, а потом опять чего-то стали делать полутоном...
Наверх
« Последняя редакция: 20.04.2006 :: 01:04:06 от Minor »  
 
IP записан
 
Вадим
Администратор
*****
Вне Форума


Всем привет!

Сообщений: 1072
Россия
Пол: male
Re: О форме электронных книг в DJVU
Ответ #6 - 20.04.2006 :: 16:51:00
 
Да, это верно. Это потому, что я пришел к тем же самым выводам - изображение в книгах передается точками. Но качество меня не устроило.
Потом я засунул страницу с изображением в Фотошоп, применил фильтр "Гаус-размытие" и изображение преобразилось. Оно уже стало более походить на реальное и почти не искажалось при DJVUировании...
Наверх
 
WWW  
IP записан
 
Minor
Активист
***
Вне Форума


Бывший участник

Сообщений: 278
Петербург
Пол: male
Re: О форме электронных книг в DJVU
Ответ #7 - 20.04.2006 :: 18:32:46
 
Вадим писал(а) 19.04.2006 :: 23:00:54:
Я сталкиваюсь с реальными файлами. Там бинарные полутоновые изображения выглядят плохо. Часто просто трудно понять что на них изображено. Вроде все понятно - изображение передано точками. Но в книге это выглядит великолепно, а в файлах, в лучшем случае, посредственно.


А где плохо, в каких книжках из библиотеки? Конечно, для нормальной передачи клише нужно 600dpi, но и на 300 оно передается вполне сносно, во всяком случае, лучше, чем полутоном. Вот в книгах от АЧ, например. Да, не чищенные (слава богу), не обработанные (зато сколько!) и все прекрасно видно. В любом случае лучше, чем полутоном. Не следует забывать и о тексте - если клише передается полутоном, весь окрестлежащий текст становится при не очень высоком качестве сканирования просто безобразным, а при сжатии в фото и подавно - целиком идет в JPG - ничего с ним потом не сделать, если захочется.

Вадим писал(а) 20.04.2006 :: 16:51:00:
Потом я засунул страницу с изображением в Фотошоп, применил фильтр "Гаус-размытие" и изображение преобразилось. Оно уже стало более походить на реальное и почти не искажалось при DJVUировании...


Я считаю, что этого делать категорически нельзя. Кому нужно, может сделать это сам - это действительно бывает нужно для вставки картинок в HTML, например - единственная возможность избавться от муара (на него не нужно обращать внимания - любые растровые изображения отображаются на растровом устройстве с муаром - это естественно, но это недостаток не оригинала, а устройства отображения). Но делается это для конкретного разрешения, конкретного размера и т.д. При любых попытках использовать картинку в другом, отличном от просмотра в натуральную величину размера (просто хочется разглядеть детали) - огромное разочарование - посмотрите извлеченный BMP (а еще лучше - напечатайте) в нативном размере и сравните с отсканированным. DJVU НЕОБРАТИМО делает из клише пятнистое безобразие. Если это фото, то и бог с ним. А если это чертеж или рисунок детали...
На мой взгляд, задача оцифровщика максимально донести до пользователя оригинал и для черно-белых изображений в DJVU это вполне возможно. При 600dpi - гарантировано - извлеченные BMP практически не отличимы (или отличаются несущественно) от изображений, полученных при сканировании. Цвет - да. Необратимо. Тут уж ничего не поделаешь - DJVU - принципиально агрессивный формат и приходится выбирать между качеством и размером.
Наверх
« Последняя редакция: 20.04.2006 :: 21:12:48 от Minor »  
 
IP записан
 
Minor
Активист
***
Вне Форума


Бывший участник

Сообщений: 278
Петербург
Пол: male
Re: О форме электронных книг в DJVU
Ответ #8 - 20.04.2006 :: 19:02:36
 
Gautier писал(а) 18.04.2006 :: 13:09:12:
А иначе за что боролись? Так, я в том многострадальном Ферде при очистке текста в граф. виде иной раз вижу опечатки, но их не исправляю.


А я исправляю. Кому ж нужны эти опечатки? Круглые глаза. Другое дело, что это нужно делать красиво (аутентично) - раздвинуть слово, если пропущена буква, например, и вставить нужную, взяв ИЗ СОСЕДНЕГО текста. Зачем огрехи-то сохранять. Биографы великих, даже самые дотошные, никогда не пишут сколько раз у биографируемого был понос после того, как он отравился в соседней столовой. Или что говорил "после литры выпитой".

Gautier писал(а) 18.04.2006 :: 13:09:12:
Другое дело, если версию в DJVU кто-то может использовать для работы, а не только для чтения или распечатки. Я имею в виду, что кто-то с нее чего-то сможет взять из текста, хотя как это можно сделать, я не знаю.


В DJVU/PDF с текстовым слоем для этого достаточно просто выделить текст на изображении, как будто он в WORDе - в буфер возьмется нормальный текст (если, конечно, текстовый слой сделан правильно). Можно выделить и всю книгу, и получить в текстовом виде. И искать, в т.ч. с плагином и стандартным Windows-ным поиском.

Gautier писал(а) 18.04.2006 :: 13:09:12:
Асинхронизация же номеров страниц в DJVU, по-моему, вещь маловажная. А если она важна (для техн. текстов), то никакие обложки там не нужны, и аутентичность тоже.


Как маловажная? А искать что либо в 800-страничном томе без указателя или хотя бы оглавления? Хорошо если только обложка - можно мысленно прибавлять на нее, так еще ж и вклейки есть - их перед этим тоже все пересчитывать, чтоб потом перед каждой ссылкой тыкать в калькулятор?

Как это не нужна (аутентичность)?!!! А формулы? Ошибка в химической формуле с заменой при распознавании N на H (сплошь и рядом) даст совсем другое соединение. Я уж не говорю про многоэтажные формульные конструкции - если кто и берет на себя труд их править в WORDе (заново набирать, точнее), то ему все равно веры нет, поскольку и трижды вычитав от ошибок не избавиться. да и вычитать серьезный научный текст могут единицы, и уж они-то, как раз, этого точно делать не будут. То же и при передаче чертежей и схем - одна лишняя точка (есть контакт на пересечении проводников или нет) - и схема не работает. Для чего и нужны факсимильные форматы в первую очередь. Точнее, такой формат пока один - PDF, а DJVU - чтоб ПОЧТИ то же малой кровью. Вот за это как раз и боролись... ИМХО.

Наверх
« Последняя редакция: 20.04.2006 :: 19:11:03 от Minor »  
 
IP записан
 
amyatishkin
Активист
***
Вне Форума


Всем привет!

Сообщений: 426
Re: О форме электронных книг в DJVU
Ответ #9 - 21.04.2006 :: 03:54:36
 
1) Важнее нумерация страниц. Но у меня ограничение (книжки лежат на народе), поэтому если файл больше 5 мб, то он режется пополам, а на нумерацию страниц приходится забивать.

2) поля делаются, но постольку-поскольку. В основном выдерживаются при сканировании.

3) Текстовый слой пока не делал, а делал отдельный txt файл. Расчет на то, чтобы его качали только при надобности (или ненадобности djvu). Книжкт технические в основном.

4) 300 dpi, так как хреново с закачкой и приходится следить за размером. В критических случаях с мелким текстом - 400-450 дпи, но за счет перевода из 300 dpi greyscale.
Разумееся, все в ч/б, кроме страниц с фотами.
Для страниц с фотами отработал процедурку так, что фота остается в сером, а текстовая часть переводится вначале в битмап, а потом обратно в серый. Ничего смотриться.
Но фоты, окромя малоценных, даю еще отдельно в виде обработанных jpg.

ЗЫ. Книжки сюда складываются: http://www.amyat.narod.ru/ , djvu-шные примерно с середины страницы начинаются.
Наверх
 
 
IP записан
 
Slawa-614
Активист
***
Вне Форума


Всем привет!

Сообщений: 380
Пол: male
Re: О форме электронных книг в DJVU
Ответ #10 - 21.04.2006 :: 11:55:40
 
1. Поля делать обязательно (файл они не увеличивают, а вот при печати из djvu разный размер страниц из-за обрезки полей - создаст некрасивую и даже - неудобочитаемую распечатку).
2. Нумерация приоритетна, особенно в djvu (в справочниках всегда нужна конкретная страница, а вовсе не весь текст в целом). Для выравнивания целесообразно убирать/добавлять "чистые" листы, либо манипулировать местоположением оглавления, выходными данными и прочей незначащей служебной информацией книги.
3. Титул (обложка) на 1 странице - желательна.
4. "Лейбл" оцифровщика - тоже необходим в самом файле. Ведь инфо из текстового доп.файла - может потеряться, а вот где искать первоисточник, в случае обнаружения ошибок, пропусков страниц или еще какого брака - непонятно.
Наверх
 

Slawa-614
 
IP записан
 
Minor
Активист
***
Вне Форума


Бывший участник

Сообщений: 278
Петербург
Пол: male
Re: О форме электронных книг в DJVU
Ответ #11 - 21.04.2006 :: 15:07:27
 
Господи, наконец-то! Спасибо Amyatishkin и Slawa-614 за страницы. А то я уж думал, что совсем...


Кстати, спасибо за ссылку
amyatishkin писал(а) 21.04.2006 :: 03:54:36:
ЗЫ. Книжки сюда складываются: http://www.amyat.narod.ru/ , djvu-шные примерно с середины страницы начинаются.


Масса интересной и ценной литературы! И сделано приятно с умом.
Наверх
« Последняя редакция: 21.04.2006 :: 20:30:22 от Minor »  
 
IP записан
 
Lykas
Патриарх
*****
Вне Форума


Всем привет!

Сообщений: 1126
Re: О форме электронных книг в DJVU
Ответ #12 - 21.04.2006 :: 16:17:59
 
2. А мне как ставить нумерацию страниц в журналах. Две страницы первой обложки, страницы журнала, восемь страниц вклеек, опять страницы журнала, задняя обложка?
Наверх
 
 
IP записан
 
Minor
Активист
***
Вне Форума


Бывший участник

Сообщений: 278
Петербург
Пол: male
Re: О форме электронных книг в DJVU
Ответ #13 - 21.04.2006 :: 18:25:57
 
Lykas писал(а) 21.04.2006 :: 16:17:59:
2. А мне как ставить нумерацию страниц в журналах


С журналами, конечно, сложнее. Но я все равно считаю, что обложку надо в конец с гиперссылкой на все поле первой страницы и
Minor писал(а) 18.04.2006 :: 09:24:28:
Если положение  
цветных вкладок не произвольно (содержат текст статьи или иллюстрации, привязанные к тексту; как в разделе "Радио -  начинающим" в журнале "Радио", например), вкладки все равно перемещаются в конец файла, а на прилежащих к ним страницах делаются видимые гиперссылки на них. На самих вкладках должны быть обратные гиперссылки. Это не так сложно - несколько  секунд на одну страницу-вкладку. Гиперссылки при печати не выводятся и факсимиле не портится.


Наверх
 
 
IP записан
 
Minor
Активист
***
Вне Форума


Бывший участник

Сообщений: 278
Петербург
Пол: male
Re: О форме электронных книг в DJVU
Ответ #14 - 21.04.2006 :: 20:52:09
 
amyatishkin писал(а) 21.04.2006 :: 03:54:36:


Во круть!
Технари, дуйте скорее сюда!
Просто обалдеть!
Давно так не прыгал от восторга (вот разве когда обнаружил у Вадима залежи от Slawa-614 и позже от АЧ)!
Наверх
 
 
IP записан
 
Slawa-614
Активист
***
Вне Форума


Всем привет!

Сообщений: 380
Пол: male
Re: О форме электронных книг в DJVU
Ответ #15 - 21.04.2006 :: 22:24:56
 
Lykas писал(а) 21.04.2006 :: 16:17:59:
2. А мне как ставить нумерацию страниц в журналах. Две страницы первой обложки, страницы журнала, восемь страниц вклеек, опять страницы журнала, задняя обложка?


Журнал - не справочник, в журнале нумерация не критична.
Наверх
 

Slawa-614
 
IP записан
 
Gautier
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 154
Re: Дискуссия - просьба почетче
Ответ #16 - 25.04.2006 :: 12:47:32
 
Я бегло просмотрел дискуссию по OCR-DJVU здесь и еще на страничке по факсимилле. Должен сказать, что все изложено и обсуждено несколько размыто, многословно и нечетко, в особенности для обычных пользователей. Вот, устроили тут эзотерику: я только здесь понял, что Минор именует "бинарными" сканами черно-белые, а "аналоговыми" - в оттенках.  И прочее, и прочее. К тому же здесь, при рассуждениях, например, о важности синхронизации страниц, упускается тот момент, что эта важность различна для разной литературы, отсюда и несогласия с Минором, и согласия с ним. Какая разница, есть синхр. или нет для худ. лит.? Понятно, что для техн. она может быть важна. Минор пеняет нам иной раз за невнимательность, а сам тоже - указал мне, что я для техн. текстов не считаю важной аутентичность, а там, де, формулы и пр. Да из контекста у меня ясно ("обложка, пустые листы") что имелась в виду аутентичность не текста, а построения книжного блока.
В общем, желательно, на мой взгляд, поменьше спец. рассужд. и слов здесь, а побольше в приложениях (я взял одно с "факсимилле", буду читать).  И желательно исходить из того, что многие, занимающиеся OCR, с программированием и его языками незнакомы. Но OCR  все равно получается.
Я всегда думал, что у техников и инженеров четкое мышление и изложение, однако, видно, все не так (впрочем, и ранее я это обнаруживал). Наиболее четкое мышление-изложение - у экспериментаторов, которые все делают "руками", а до делания продумывают этапы в голове. К сожалению, среди программисто экспериментаторов видать нет.
Наверх
 
 
IP записан
 
IG
Новичок
*
Вне Форума


Всем привет!

Сообщений: 21
Ярославль
Пол: male
Re: О форме электронных книг в DJVU
Ответ #17 - 12.06.2006 :: 12:07:37
 
Minor писал(а) 18.04.2006 :: 09:24:28:
1. Главный вопрос: что приоритетнее - обложка вначале или синхронная нумерация страниц? Для большинства книг - это
альтернатива, не допускающая компромисса. О целесообразности введения в файл обложки речь, вроде, сейчас не идет, хоть
это и ощутимо увеличивает его размер. Одного взгляда достаточно, чтобы узнать "с детства знакомую книгу" или просто
знакомую или, что это как раз то издание. Вот стоит ли помещать заднюю страничку обложки, если на ней кроме  
"Цена 30 коп." нет больше никакой информации - это тоже вопрос... И конечно, красиво, если книжка всегда открывается
обложкой. Сразу определенный настрой создается... Однако, при этом, как правило (за исключением случаев, когда первая
страница пуста или содержит несущественную информацию - логотип издательства, например), нумерация страниц в DJVU/PDF-
файле и в оригинале перстают соответствовать друг другу.

Хорошая нумерация ещё никому не повредила и не повредит, но главное правило, ИМХО, "всё зависит от книги". Как ни крути, почти каждая книга-индивидуальна.
Во-первых, номера страниц нужны, чтобы к ним обращаться. По ссылкам из содержания, или внутри книги. Соответственно, чем больше книга содержит таких ссылок, тем важнее номера страниц. Обычно они очень нужны в научно-технической литературе, просмотр которой почти всегда начинается с поиска нужной информации по содержанию и предметному указателю... А если это художественное произведение одно на целую книгу, или может даже технический справочник, но состоящий из одной огромной таблицы, не содержащей дополнительной индексации по номерам страниц, то кто будет обращать внимание на номера? Если в книге есть уже 2-3 произведения (или таблицы) то на содержание будут уже иногда смотреть, но редко. Ну и, ессесно, страницы очень нужны, если содержание из десятков пунктов, предметный указатель в конце, или какая-то индексация таблиц (напр, справочник по каким-нить транзисторам, описания группируются по характеристикам, а в конце притаилась таблица всех упомянуты приборов по алфавиту со ссылкой на страницу с описанием)
Далее: функция обложки. В художественной литературе-она не последний элемент, одна из иллюстраций, плюс возможность "узнать с детства знакомую книгу" и всё такое... Сам подобные чувства испытывал. Улыбка Такую обложку не грех и вперёд поставить. Даже если номера чуть съедут, но содержание из 3 пунктов и нет других ссылок-не страшно. Если ссылок побольше-решение за цифровщиком, можно вставить обложку и попытаться компенсировать разброд гиперссылками, например. У технической литературы назначение утилитарное. Поэтому главное-страницы, а красивости могут подождать. Если обложка не влезает-в конец её, кому надо-найдут.
Но это ладно, дык встречаются такие книги, которые как ни крутись нельзя выровнять! Например, десяток страниц введения и содержания пронумерованы римскими цифрами, а сам текст-арабскими с 1. И что делать. ИМХО, решить проблему раз и навсегда можно только средствами софта, включив в файл информацию о номерах страниц, вернее об их названиях (Ибо бывают такие извраты, что диву даёшься!). Формат ДоЖиВу должен это позволить, нужен только софт, умеющий их вставлять, и софт умеющий их читать...
На вопрос "надо ли" отвечу: ИМХО, всё надо! Очень приятно видеть скан в котором есть всё: и типографские данные и все титульные листы и передняя часть обложки и задняя... Я бы даже ещё и корешок включил. Кому-нибудь эта информация да пригодится. Обложка, хотя бы уменьшеная (если жалко места), очень пригодится, чтобы выставить книгу на сайте. А может я хочу сделать "виртуальную книжную полку" и выставить на сайте корешки? А може мне интересны выходные данные, например, с какого издания книги сделан скан? Да и как я могу судить, что сзади только "цена 30коп." если своими глазами не увижу? Улыбка Всё важно. Тем более что "30 коп" после соответствующей обработки наверняка неплохо сожмутся. Улыбка
И даже есть мысли о том, что неплохо бы ввести традицию среди оцифровщиков-вставлять в книгу СВОЮ новую страницу (туда, где она не помешает читателю, напр. в самый конец или для затыкания пустоты и выравнивания номеров-в начале), где в дружелюбной форме Улыбка расписать всю техническую информацию о книге. Например, кто сканировал-обрабатывал-паковал, когда, как, примечания, которые цифровщик считает важными, что отреставрировано, какие есть неисправленые дефекты, на этой же страничке можно вести протокол версий и изменений-некоторые любят "вылизывать" чужие сканы, исправлять ошибки и т.д., кто-то сканирует по второму разу, а некоторые любят просто пихнуть свой логотип (как например на powerbook.org) в результате, когда в коллекции собирается куча версий одной и той же книги и непонятно, чем они отличаются и какая лучше... Ужас, короче. Улыбка Занимать эта "техническая страница" будет килобайт 10 (если на ней замысловатые картины не малевать), а польза от неё есть... Хорошее решение так горячо обсуждаемого вопроса "стоит ли что-то менять" можно изменить и оставить здесь упоминание о несоответствии оригиналу.

ЗЫ: Хотя, подобные рассуждения как-ни крути могут быть максимум рекомендациями, и каждый делает так, как хочет. Поэтому, если кто-то вдруг задумает (надеюсь! Подмигивание) написать "универсальное пособие для оцифровщиков", то заранее предостерегаю не писать кратко "как надо делать", такое пособие одни проигнорируют, а другие устроят ситуацию "заставь дурака богу молиться". Лучше подробно описать, что МОЖНО сделать, как это сделать проще и чем это будет полезно для других. И зная это пусть каждый сам решает, как ему работать. Всё равно каждая книга индивидуальна, каждая цифрокопия-это уже редакция книги, каждый оцифровщик-в какой-то степени редактор со своей ответственностью перед читателями. При этом никто не имеет право ничего требовать, поскольку это любительское сообщество, где каждый скан это уже труд (бесплатный!), обдадающий какой-никакой ценностью, и где каждый оцифровщик работате как умеет, и имеет право не тратить свои силы на то, чего он делать не хочет...
Наверх
« Последняя редакция: 12.06.2006 :: 12:22:11 от IG »  
 
IP записан
 
IG
Новичок
*
Вне Форума


Всем привет!

Сообщений: 21
Ярославль
Пол: male
Re: О форме электронных книг в DJVU
Ответ #18 - 12.06.2006 :: 13:10:04
 
Minor писал(а) 18.04.2006 :: 09:24:28:
2. Поля. Я считаю, что поля (их размеры и соотношение ширин) должны соответствовать полям оригинала. Тогда при  
распечатке мы получаем факсимильную копию книги. Вопросу соотношения ширин правого и левого полей в полиграфии  
придается большое значение. Есть несколько основных схем, но все они предполагают неравенство внутреннего и внешнего
полей. Альтернативы: равные правое и левое поля; совсем без полей. Аргумент в пользу равных полей - текстовый блок
не бегает при листании в браузере. Серьезных аргументов в пользу отсутствия полей я не знаю (лень чистить?), но делают
их многие. На мой взгляд, поля очень сильно влияют на восприятие текста - я испытываю большие неудобства, читая книги  
без них...

1) Неравные поля, ИМХО, нужны для книги, когда часть поля загибается в разворот. При просмотре с монитора ничего не загибается, а учитывая, что большинство смотрелок строят все листы сверху вниз, и из-за неравных полей всё начинает скакть вправо-влево.

2)"При распечатке, при распечатке..." Улыбка А кто печатать-то будет? Я вот не буду. Надо всё-таки определиться для чего делается книга. ИМХО:

Во-первых, сканам уготована участь полупиратских цифровых копий, передающихся и спользующихся пользователями преимущественно в цифровом виде. Я не знаю пользователей, готовых распечатывать ДЖВ чтобы почитать с комфортом. Максимум-пару страниц с ценной информацией. Улыбка

Во-вторых если кто-то возьмётся печатать, да с такой дотошностью, что станет важен размер полей, то это уже будет скорее "переиздание", со всеми его заморочками, из которых добавление необходимых полей-не самая страшная.

3)Без полей действительно некрасиво. Для обычной книги порядка 1 см минимум по краям должно быть.

Итого: самые хорошие поля-приблизительно повторяющие поля книги (хотя сверхточность и не нужна), при этом выровненые симметрично, например, путём обрезания большего поля со стороны корешка, если остальные 3 примерно равны а это выделяется.
И ещё: возможно, книгу заново переплетали (бывает...), и при этом заново обровняли края страниц, в некоторых местах обрезав вплотную под текст, такие "поля" естественно сохранять не стоит, желательно их восстановить до разумных размеров.

ЗЫ: Вопрос в тему: чем таким простым типа IrfanView можно добавить к куче страниц поля "автоматом", т.е. в пакетном режиме? Ирфан может отрезать, но вот добавлять не может. Кромсатор так и не освоил пока.
Наверх
« Последняя редакция: 12.06.2006 :: 14:38:15 от IG »  
 
IP записан
 
IG
Новичок
*
Вне Форума


Всем привет!

Сообщений: 21
Ярославль
Пол: male
Re: О форме электронных книг в DJVU
Ответ #19 - 12.06.2006 :: 13:28:42
 
Minor писал(а) 18.04.2006 :: 09:24:28:
3. Текстовый слой и гиперссылки. Текстовый слой, на мой взгляд, нужно добавлять безусловно, хоть это и ведет к
некоторому увеличению объема (примерно, как от введения половины задней страницы обложки  ). И добавить, ведь, теперь
не трудно [...] Почему?
О целесообразности гиперссылок (скажем, переход из оглавления к соответствующей странице) вопрос не стоит. Места они
дополнительного не занимают. Каждый DJVU-ист сам решает, тратить на них время и труд или нет. На мой взгляд, в научной
и учебной литературе они необходимы (особенно межстраничные ссылки). Вопрос в другом: нужно ли выделять их цветом, или
негативом, или вообще как-то выделять?
[...]
Я склоняюсь к тому, чтоб их никак не выделять - оставлять невидимыми, чтоб тем,
кому не нужно, глаза не мозолили, а куда щелкать - человек быстро осваивается, особенно если делать их вплотную друг к
другу.

Почему? По большей части просто не все умеют и хотят, вот почему. Или можно предположить что (иногда) потому, что не у всех такие мощные машины, чтоб провернуть несколько сотен страниц через фень-ридер за разумное время, и не у всех стоит последний пиратский DEE (и тем более не у всех-легальный Улыбка), очень много народу до сих пор на "соло 3.1 нонкомм" сидят.
А ссылки-согласен, броские выделения портят текст. Но, выделить всё-таки нужно, как-нибудь, чтоб было еле-еле заметно. Например, прозрачным светло-желтым/голубым/розовым цветом (по белому фону) если без всяких рамочек-вполне уместно.
Наверх
 
 
IP записан
 
IG
Новичок
*
Вне Форума


Всем привет!

Сообщений: 21
Ярославль
Пол: male
Re: О форме электронных книг в DJVU
Ответ #20 - 12.06.2006 :: 14:24:45
 
Minor писал(а) 18.04.2006 :: 09:24:28:
4. Клише (растровые изображения). В смысле, насколько важна передача клише бинарно. Большинство клише вполне сносно
передаются бинарно на300 dpi. На 600 dpi можно безусловно передать бинарно любое типографское клише. Почему-то многие
оцифровщики передают его, а то и всю страницу, полутоном. Зачем? Конечно, полутоном, даже с 16-ю градациями, клише
смотрится немного лучше, но DJVU-кодер все равно потом превращает все в кашу серых пятен (если не использовать режим
photo; но в этом случае у DJVU нет практически никаких преимуществ перед PDF). Трудоемкость снятия полутоном, особенно,
если только клише, а текст бинарно, не ниже, а в последнем случае ощитимо выше, чем даже если страницу отсканировать
дважды с оптимальными для текста и клише параметрами и вставить потом содержимое одной страницы в другую. Если  
страницы с клише целиком выполняются в полутоне, вид документа совсем безобразен, на мой взгляд, особенно при даже
небольшом увеличении (по ширине страницы, например).
Я за безусловно бинарную (в конечном DJVU-файле) передачу клише - как в оригинале.

Аха... Я уже тоже успел над этим задуматься... После того как посидел в раздумьях над серым 600dpi сканом, вспоминая название известной книги Чернышевского. Большинство страниц можно было смело конвертнуть в бинарный формат, и они от этого только выиграют... Но вот на некоторых есть "серые" фотографии, сделаные растром из точек... Пробовал засунуть в соло "как есть" в режиме scanned-получил бяку: половина точек перешла в текст, половина в фон, получилось месиво. Что-то делать в граф. редакторах было лень. Вобщем, после недолгих колебаний я решил что при 600дпи точки видны очень даже неплохо, и я "могу себе такое позволить", и конвертнул в однобитный формат всё. Получилось неплохо, точки растра сохранились, и если смотреть в той же соло, то она эти точки усредняет и показывает вполне съедобную серую картинку. При печати на 600дпи лазернике тоже всё ок будет. Однако не всякий просмотрщик способен такой рисунок грамотно уменьшить, некоторые просто берут "через пиксель" и такой ужас показывают... Улыбка

Так что если 600дпи и больше, то можно смело конвертить в 2 цвета, только, возможно, порог (если есть возможность) надо подобрать точнее для лучшего качества (чтоб большие точки не сливались, маленькие не исчезали)

А вот если разрешение скана меньше, то тут уже в зависимости от "разрешения" типографского растра, возможно, отдельные точки сольются и будут нужны другие подходы. Например размыть в граф редакторе фотку чтоб сделать её "серой". Но "малой кровью" здесь отделаться не получится, ИМХО... Хорошо картинка смотрится когда она либо целиком в тексте, либо целиком в фоне. Когда она разбивается на части-получается некрасиво, слишком большая разница в разрешении между Т и Ф и разные искажения при сжатии. Отсюда методы борьбы:

--Вроде бы можно увеличить разрешение фона, т.к. оно задаётся где-то в конфигурации компрессора. Это не избавит от изъянов, но хотя бы сгладит их. Можно попытаться даже поискать настройки отвечающие за деление картинки на текст и фон, где-то я подобное даже видел (DjVUeditor какой-то версии), попробовал для интереса покрутить, но ничего хорошего не вышло...

--Кодировать всю страницу в фото. Одну картинку на всю страницу-вполне можно. Только предварительно её "размазать" до равномерности, и высветлить фон до белости. Фактура фона и резкие края "точечек" при сжатии жрут лишний объём а полезной информации не несут. Но если на странице много текста, то неудобно-либо текст расплывчатый, либо размер огромный, либо и то и то.

--Можно попытаться поколдовать в граф. редакторе, размазав картинку и при этом конвертнуть текст в 2 цвета и надеяться, что кодер это обработает как надо. Ну и естественно, если информация уходит в фон, желательно разрешение этого самого фона увеличить, степень сжатия уменьшить, если кодер позволяет (я просто не в курсе возможностей свежего софта). Если всё получится, будет красиво, но... у ДЖВ компрессоров свои понятия, и гарантированного результата ожидать нельзя. Я не пробовал, но не удивлюсь, что даже при зверском размытии чей-нибудь глаз на какой-нибудь фотографии так понравится кодеру, что всё равно уйдёт в foreground и будет как будто неким шутником пририсованый. А в background останется картинка и того веселей...

--А идеальное решение, как всегда, возможно только на уровне софта. Дать пользователю побольше кнопочек и ручек для того чтоб он в проблемных случаях мог вмешиваться в работу ДЖВ-кодеров, например, корректируя разрешение и степень сжатия фона или указывая, что можно вытащить в текстовый слой, что нужно вытащить а что вытаскивать нельзя...
Наверх
 
 
IP записан
 
IG
Новичок
*
Вне Форума


Всем привет!

Сообщений: 21
Ярославль
Пол: male
Re: О форме электронных книг в DJVU
Ответ #21 - 12.06.2006 :: 14:31:12
 
Minor писал(а) 18.04.2006 :: 09:24:28:
Рекомендуемый вариант ответа:"По всем пунктам целиком и полностью согласен с Minorом"  

А ответы, не соответствующие рекомендуемому варианту-засчитываются?  Круглые глаза
Наверх
 
 
IP записан
 
Minor
Активист
***
Вне Форума


Бывший участник

Сообщений: 278
Петербург
Пол: male
Re: О форме электронных книг в DJVU
Ответ #22 - 13.06.2006 :: 10:21:09
 
IG писал(а) 12.06.2006 :: 13:10:04:
Я не знаю пользователей, готовых распечатывать ДЖВ чтобы почитать с комфортом. Максимум-пару страниц с ценной информацией. Улыбка.


А я знаю. Себя, например. Кроме того, страдающим старческой дальнозоркостью (после 40-45, обычно) иногда хочется покрупнее. Например, вдвое - страницу на лист A4. Я все книги делаю так, чтоб при печати с четырехкратным увеличением смотрелись как типографские. Тогда приятно читать Подмигивание.

IG писал(а) 12.06.2006 :: 13:10:04:
ЗЫ: Вопрос в тему: чем таким простым типа IrfanView можно добавить к куче страниц поля "автоматом", т.е. в пакетном режиме? Ирфан может отрезать, но вот добавлять не может. Кромсатор так и не освоил пока.


Я считаю, что автоматом нигде добавить нельзя - только новая страница с последующей вставкой. Обрезать с центрированием, считаю, тоже. Только вручную. Очень надеюсь, что кто-то оспорит.

IG писал(а) 12.06.2006 :: 13:28:42:
не у всех стоит последний пиратский DEE (и тем более не у всех-легальный Улыбка), очень много народу до сих пор на "соло 3.1 нонкомм" сидят.


Легальные (принципиальные) книг не сканируют (ни одного не видел), разве что за деньги (тогда легальные версии у них казенные). Никто не мешает зайти по тысячекратно указанной на форуме ссылке и скачать нелегальный.
А на 3.1 я и сейчас стою и стоять буду - только он позволяет делать "как надо".

IG писал(а) 12.06.2006 :: 14:31:12:
А ответы, не соответствующие рекомендуемому варианту-засчитываются?  Круглые глаза


Это уж конкретно ко мне. Спасибо за ответы. Только я уж с этой темой подзавязал. Не попал в резонанс. Не делают по той дорожке, на которую я пытался склонить. И не будут в ближайшее время, как я понял. Странно мне это. За последние пять лет мощности выросли на порядок, цена на носители упала на порядок, а как делали 300dpi с мазней в клише, так и делают. По краней мере на форуме (это не везде, к счастью - "Колхоз" помаленьку начинает идти в ногу со временем. ВСЕ новые сканы там 600 с текстовым слоем (безусловно) и дубли 300е, которые раньше держали для тех, кому нужно похуже, но поменьше, теперь убирают - не нужно никому. И разворотные. И грязные. И в старые почти во все добавили текстовый слой, и чистят помаленьку).
Хотелось народ повернуть от дурной работы, чтоб хоть ныне сделанное потом переделывать не пришлось. А придется безусловно. Вот как MP3 теперь почти все заново пережали в 192, а то и в 256 (классику, по крайней мере). Вот так, как я СЕЙЧАС делаю (про раньше не скажу - сам сейчас переделываю - благо у меня все TIFFы хранятся), точно не придется, поскольку ПО ВСЕМ ПАРАМЕТРАМ электронная книга лучше бумажной и позволяет в случае нужды ее воспроизвести. С текстом и гиперссылками, а теперь еще и единый файл для многотомных изданий. Последнее дает принципиально новые возможности. Пример из текущих: полное собрание сочинений И.С.Баха (49 томов нотного формата, около 16000 страниц - их 50 лет печатали; изначальный скан не мой, разумеется) со сводным ссылочным каталогом в соответствие с BWV (последний появился только в 1950х, а издание завершено в 1900). Найти что-либо в 50ти томах без каталога, только по названию было весьма проблематично, тем более, что индексного тома в этом издании нет. Теперь же любое произведение можно найти за несколько секунд. Поиск строки, находящейся в конце файла, из начала - максимум 15 секунд. Переход по ссылке из каталога - доли секунды.
Другой пример (следующий мой проект): двенадцатитомник "Общей органической химии" (название неудачно переведено - на самом деле это глобальное руководство по синтезу всех классов оргсоединений; самое глобальное). Там только один ссылочный том насчитывает около 900 страниц. Чтобы что-то найти в бумажном, ой как много сил и времени надо. И не процитировать, и не скопировать (если кому послать). А если все в одном файле, да с поиском, да с гипер... Можно и БСЭ бы было в единственный (тут даже Gautier бы согласился со мной), только это без меня - не нужна она, на мой взгляд.

Короче, считаю, что делать надо так, чтоб совершенно не жалеть об оригинале в случае его безвозвратной утраты.

Нет, ни под каким видом не хочет никто факсимиле. Вернее, как я уж говорил, я тут лишний - выпадаю, в т.ч. идеологически. Просто я сканирую для себя. Мне САМОМУ нужны книги, которые я сканирую, вот и искал таких же, чтоб хоть скоординироваться и не делать дважды одно и то же. Только в форум люди, которые мне интересны (АЧ, например, или Константин К.), чего-то не заглядывают. Змий сбежал... А большинство на форуме сканирует для "Грядущих поколений" или просто для людей, выполняя какую-то непонятную мне миссию. Признаться, мне никогда не была понятна позиция многих родителей, собирающих книги "для детей" (самим родителям не нужных).  Эту тему я еще со школы отслеживаю и НИ РАЗУ не наблюдал, чтоб эти "дети" (для которых собирают) потом это собранное читали. Если родителям не нужно, то детям-то уж точно - это закон (касательно книг). Как правило, идет в букинист хрустящим или на помойку при переездах или расширении семейства без увеличения пространства. Исключение составляют редкие букинистические библиотеки с кожанными переплетами и золотыми обрезами - но то уж и не книги, а вещи скорее.

Вот для чего Чехова ПСС в том же текстовом виде сканируют мне тоже непонятно. Еще в 2001м ИДДК выпустил диск с ним. Очень хорошо сделанный. С рисунками, фотографиями, сопутствующими документами. Причем, как я понял, тексты там прямо с издательских электронных залежей, т.е. заведомо вычитанные...

ЗЫ. Вот над чем я, пожалуй, подумаю, так это стоит ли пихать свое "Hi-Copy" на первую страницу. Может, действительно, лучше отдельной страничкой в конце with comments и "инструкцией по эксплуатации" (мол, смотрите, кто не знает, есть там текстовый слой и гиперссылки. И странички совпадают...).
Наверх
« Последняя редакция: 13.06.2006 :: 18:11:42 от Minor »  
 
IP записан
 
amyatishkin
Активист
***
Вне Форума


Всем привет!

Сообщений: 426
Re: О форме электронных книг в DJVU
Ответ #23 - 13.06.2006 :: 17:08:02
 
Minor писал(а) 13.06.2006 :: 10:21:09:
Я считаю, что автоматом нигде добавить нельзя - только новая страница с последующей вставкой.


"Увеличивать размер холста" умеют Фотошоп и XnView. Это из тех, чем пользуюсь.
Наверх
 
 
IP записан
 
Minor
Активист
***
Вне Форума


Бывший участник

Сообщений: 278
Петербург
Пол: male
Re: О форме электронных книг в DJVU
Ответ #24 - 13.06.2006 :: 17:27:41
 
amyatishkin писал(а) 13.06.2006 :: 17:08:02:
"Увеличивать размер холста" умеют Фотошоп и XnView. Это из тех, чем пользуюсь.


Пакетом? В противном случае - это то же самое, что вставить в шаблон. По времени и трудоемкости.
Заранее спасибо
Наверх
 
 
IP записан
 
Minor
Активист
***
Вне Форума


Бывший участник

Сообщений: 278
Петербург
Пол: male
Re: О форме электронных книг в DJVU
Ответ #25 - 13.06.2006 :: 17:57:38
 
Ага! XnView умеет пакетом!
Вот спасибо! Очень довольный
Наверх
 
 
IP записан
 
Minor
Активист
***
Вне Форума


Бывший участник

Сообщений: 278
Петербург
Пол: male
Re: О форме электронных книг в DJVU
Ответ #26 - 13.06.2006 :: 18:10:34
 
Ха! Мой любимый PaintShop тоже умеет. И пакетом (через скрипт если - это достоинство - все, что можно в скрипте для одного, можно и пакетом). Вот что значит лень-матушка. Пока не припрет или пока добрые люди не подскажут...
Наверх
 
 
IP записан
 
IG
Новичок
*
Вне Форума


Всем привет!

Сообщений: 21
Ярославль
Пол: male
Re: О форме электронных книг в DJVU
Ответ #27 - 14.06.2006 :: 01:38:15
 
Minor писал(а) 13.06.2006 :: 10:21:09:
За последние пять лет мощности выросли на порядок, цена на носители упала на порядок, а как делали 300dpi с мазней в клише, так и делают.

Одна простая причина, ИМХО-сканируется дольше. Вот пользовал я сканер с портом USB 1.1... У него скорость сканирования определяется скоростью передачи данных. 20 и более секунд на страницу при серых 600дпи. 300 быстрее в разы.
Сейчас уже USB 2.0 сканеры есть, но вот потестить не доводилось пока...
Наверх
 
 
IP записан
 
IG
Новичок
*
Вне Форума


Всем привет!

Сообщений: 21
Ярославль
Пол: male
Re: О форме электронных книг в DJVU
Ответ #28 - 14.06.2006 :: 01:59:05
 
Minor писал(а) 13.06.2006 :: 10:21:09:
Пример из текущих: полное собрание сочинений И.С.Баха (49 томов нотного формата, около 16000 страниц - их 50 лет печатали; изначальный скан не мой, разумеется) со сводным ссылочным каталогом в соответствие с BWV (последний появился только в 1950х, а издание завершено в 1900). Найти что-либо в 50ти томах без каталога, только по названию было весьма проблематично, тем более, что индексного тома в этом издании нет. Теперь же любое произведение можно найти за несколько секунд. Поиск строки, находящейся в конце файла, из начала - максимум 15 секунд. Переход по ссылке из каталога - доли секунды.
Другой пример (следующий мой проект): двенадцатитомник "Общей органической химии" (название неудачно переведено - на самом деле это глобальное руководство по синтезу всех классов оргсоединений; самое глобальное). Там только один ссылочный том насчитывает около 900 страниц. Чтобы что-то найти в бумажном, ой как много сил и времени надо. И не процитировать, и не скопировать (если кому послать). А если все в одном файле, да с поиском, да с гипер...

Хм... По какому поводу и мотиву такие усилия и где могут быть доступны простым смертным их результаты? Для себя и всеобщего пользования? Или это работа "на дядю" и дядя за просто так (инет+пара тычков мышью) всем результат этой работы раздавать не будет?...
Наверх
 
 
IP записан
 
Minor
Активист
***
Вне Форума


Бывший участник

Сообщений: 278
Петербург
Пол: male
Re: О форме электронных книг в DJVU
Ответ #29 - 14.06.2006 :: 03:23:51
 
IG писал(а) 14.06.2006 :: 01:59:05:
Хм... По какому поводу и мотиву такие усилия и где могут быть доступны простым смертным их результаты? Для себя и всеобщего пользования? Или это работа "на дядю" и дядя за просто так (инет+пара тычков мышью) всем результат этой работы раздавать не будет?...


Да нет, Бах еще в работе - каталог надо еще доперевести с французского (только на нем есть полномасштабный с детализацией по частям) на английский (заменой пословно, поскольку там есть еще немецкий и итальянский, которые нельзя трогать) - это два-три месяца. Пока был испытан только макет с пустышкой вместо каталога, для выяснения временных параметров. Публикация этого файла изначально не предусматривалась. По многим причинам. Не для интернета это (600М файл). Да и не нужен он реально в России никому, ни платно, ни бесплатно, чего изначально англоязычным делается. Так, разве, чтоб лежало. Не будет, короче, в публичном доступе. А мне он жизненно необходим. У меня крупнейшая в мире  Подмигивание систематизированная библиотека классической музыки, вполне тянущая на статус Национальной. К сожалению, не русской, чего также изначально англоязычная.
Если нужно просто ПСС - www.tarakanov.net (там есть ссылки и на другие, где есть); есть и на DVD сейчас вроде, в PDF.
А этот файл я просто привел в качестве примера - что вообще можно. Это неочевидно (по крайней мере, при приемлемом времени отклика). Кстати, насколько мне удалось выяснить, такие сверхбольшие файлы вообще можно делать только в DJVU - еще один аргумент в его пользу.

Что касается "Общей органической химии", то это только в плане - всего несколько сот страниц отсканировано. Это да - для публичного пользования. Будет в колхозе. Но размер (думаю, будет что-то в пределах 150-200М) и сроки выхода даже примерно пока сообщить не могу - в фоне это, для меня уж неактуально.
Наверх
« Последняя редакция: 14.06.2006 :: 03:36:37 от Minor »  
 
IP записан
 
Страниц: 1 2 3 
Послать Тему Печать