OCR форумы Добро пожаловать, Гость. Пожалуйста, выберите Вход или Регистрация
Всем привет!
Hi all!
 
  ГлавнаяСправкаПоискВходРегистрация Администратор Библиотека  
 
Переключение на Главную Страницу Страниц: 1
Послать Тему Печать
Формат для автора, авторской публикации (Прочитано 9757 раз)
romulus
Новичок
*
Вне Форума


Всем привет!

Сообщений: 8
Формат для автора, авторской публикации
08.08.2007 :: 13:29:23
 
Есть ли на форуме авторы?

ИМХО, есть разница, работаете ли вы, копируя чужие книги или свои собственные, или авторские (проблема защита от копирования и другие смежные проблемы).

Проблема не только ваших собственных или чужих (!) авторских прав, но и используемых форматов.

Глобального помешательства на формате Djvu пока не происходит, есть только локальное помешательство (местами ;-).
Эйфория мировых библиотек давно прошла, отказа от ПДФ в пользу Дежавю не произошло ввиду политики владельцев авторских прав на этот формат. Более того, случился кризис и возврат-откат к ПДФу (а какие были пушистые намерения...) со стороны всех мировых библиотек.

То есть, если вы автор, то использование этого формата (Дежавю) нарушает копирайт, если у вас нет лицензии,
когда вы делвете публикацию в этом формате. Другими словами, вас можно засудить. также, как и за использование копирайтного шрифта ваших публикаций (еще надо почитать что там мелкософт пишет по этому поводу, может и Times New Roman для авторских публикаций не годится).  

Не вполне уверен, что легально копирование и расространение любых материалов в Дежавю формате без откатных взносов (а иначе не было бы бесплатного онлайн преобразования файлов на сайте владельцев прав).  В любом случае, Дежавю - не свободный формат  в том смысле, что нет бесплатного софта для его производства (хотя может и написано где-то, что это "свободный формат", но без свободного софта). И мировые библиотеки им не пользуются, а ПДФ (тоже не свободный, кста, формат, но все библиотеки имеют лицензию).  

Произвел кое-какие археологические раскопки, [u]юридически свободным форматом является Тифф[/u]. Гарантированно.

Рекомендуется [u]tiff compressed group 4[/u] (бинарный факсовый формат), всего то в пару раз больше , чем Дежавю, получаются файлы. Качество чтения повышается добавлением уровня серого в программе просмотра (напр.  Imaging - Kodak, IrfanView - очень плохо, XnView - очень хорошо). То есть, при чтении просто изображение становится как бы 8-битным. Это больше чем достаточно для получения перфектного качества.

Для защиты своих сканов и авторских прав добавляете в графике свой логотип прямо на текст книги. На каждую страницу, например, бэкграундом. Таким образом будет надежнее, чем паролить ехе-файл в тхт-формате вашей книги.

Думаю, что у каждого автора будет своя технология изготовления и тиражирования, а также распространения своих трудов-книг в Тифф формате, а также защиты своих прав. Хорошая альтернатива ПДФ. Есть и преимущества, например создания гиперссылок с помощью ХТМЛ-файлов. А с ПДФ это возможно только внутри ПДФ, да и сложно (!) манипуляционно, закрытая система получается, в то время как с ХТМЛ получаем открытую архитектуру.

ХЭППИ СКАНОВ И ПУБЛИКАЦИЙ.

ПС. Есть люди, помешанные на "факсимиле"-качестве сканов. Так этот тифф формат и есть как раз 100% факсимиле по определению )

ППС. Господа авторы и производители-распространители чужих цифровых изданий, предлагаю для того, чтобы избежать "базара с прокурором" (вспомнить только цирк с Поносовым), обзавестись лицензиями на ваш софт в форматах DjVu, PDF и шрифты, даже если вы будете уверять, что не преследовали коммерческих интересов (А Поносов, что, преследовал?). С 1.1.2008 базара должно быть как никогда много.

ПППС. У нас районная фининспекция / департамент уже не принимает отчетов от юридических лиц и самозанятых без справки о легальности софта








Наверх
« Последняя редакция: 08.08.2007 :: 17:27:32 от romulus »  
 
IP записан
 
ghosty
Новичок
*
Вне Форума


Всем привет!

Сообщений: 3
Re: Формат для автора, авторской публикации
Ответ #1 - 09.08.2007 :: 13:58:18
 
В Ваших выводах довольно много очевидных ошибок, и, учитывая нехватку времени, я не смогу их все исправить.
Цитата:
В любом случае, Дежавю - не свободный формат  в том смысле, что нет бесплатного софта для его производства (хотя может и написано где-то, что это "свободный формат", но без свободного софта).
DJVU - свободный формат, соответственно, есть абсолютно бесплатные утилиты для работы с ним - как кодировщики (minidjvu), так и программы просмотра (WinDjView), которые ни в чем не уступают коммерческим.
Здесь небольшое уточнение. DJVU является свободным до определенной версии (номер не помню, можно уточнить, по-моему, 22). Подробнее о версиях DJVU: http://planetdjvu.opendoc.it/viewtopic.php?t=518
После этого он был куплен сначала Lizard'ом, затем Celartem. В коммерческих версиях добавились всякие "рюшечки", вроде цветных аннотаций и DRM. Политика у новых владельцев действительно дебильная, но для нас это не важно.
Для перевода в PDF без лицензионного софта не обойтись, как Вам известно.
Цитата:
Рекомендуется tiff compressed group 4 (бинарный факсовый формат), всего то в пару раз больше , чем Дежавю, получаются файлы.
При умелом создании DJVU - раз в двадцать!
Единственный способ значительно уменьшить объем TIFF - CPC-оптимизация. Но кодер CPC лицензионный, хотя доказать, что TIFF был оптимизирован с его помощью, сложновато. Однако даже после оптимизации такой TIFF по объему будет превышать DJVU раз в 8-16.
Т.е. оптимальный формат для организации электронной "факсимильной" библиотеки - именно DJVU. Нагрузка на сервер при его использовании (в отличие от TIFF, PDF) снизится в разы.

Далее DJVU vs PDF. Если делать факсимильную книгу в PDF и использовать G4, то это будет тот же многостраничный TIFF, просто с возможностью добавления оглавления. Объем получается совершенно неприемлемый, как ни крути. Особенно, если говорить о создании библиотеки.
Но дело в том, что и тот, и другой форматы используют родственные кодеры для сжатия графического текста. Это JBIG2 для PDF и JB2 для DJVU. Большая неприятность для Adobe состоит в том, что JBIG2 значительно проигрывает JB2 и CPC как в скорости кодирования, так и, что самое важное, в скорости декодирования. Именно поэтому графические PDF'ы с JBIG2 сжатием так тяжко читать. Более того, JBIG2-файлы (PDF) получаются, как правило, в 2-5 раз больше JB2-файлов (DJVU).
По поводу распространенности форматов. Да, Adobe именно в силу вышеобозначенных причин проводил и проводит очень агрессивную политику, в том числе и по отношению к нынешним владельцам DJVU. Поэтому Celartem, похоже, решил просто сконцентрироваться на другом рынке - азиатском, и хотя бы для начала одержать победу на своей территории.

Вот пример DJVU в моем исполнении: http://rapidshare.com/files/46481215/Kirk_Raven_OCR_Index_TOC.djvu.html (для просмотра лучше использовать WinDjView 0.5)
В этой книге 500 страниц. Оптимизированный многостраничный CPC-TIFF для нее весит 43 Мб.
DJVU со встроенным OCR-слоем - ~5Мб. Время обработки (ручной, без учета сканирования) - около получаса. Книга 70-го года, гибкий переплет, была в плохом состоянии. Что называется, думайте сами, решайте сами...
Наверх
 
 
IP записан
 
Lykas
Патриарх
*****
Вне Форума


Всем привет!

Сообщений: 1129
Re: Формат для автора, авторской публикации
Ответ #2 - 09.08.2007 :: 14:48:06
 
Цитата:
Для перевода в PDF без лицензионного софта не обойтись, как Вам известно.

ОпенОфис.
Наверх
 
 
IP записан
 
ghosty
Новичок
*
Вне Форума


Всем привет!

Сообщений: 3
Re: Формат для автора, авторской публикации
Ответ #3 - 09.08.2007 :: 18:10:55
 
Lykas писал(а) 09.08.2007 :: 14:48:06:
ОпенОфис.
PDF графический? JBIG2??
Наверх
 
 
IP записан
 
ghosty
Новичок
*
Вне Форума


Всем привет!

Сообщений: 3
Re: Формат для автора, авторской публикации
Ответ #4 - 10.08.2007 :: 16:54:03
 
Вот типичный пример:
http://www.archive.org/details/religioninuniver00cornrich
Обратите внимание на Digitizing Sponsor, кстати.
Наверх
 
 
IP записан
 
romulus
Новичок
*
Вне Форума


Всем привет!

Сообщений: 8
Re: Формат для автора, авторской публикации
Ответ #5 - 24.08.2007 :: 00:48:31
 
Не соберусь вам ответить все время, но давно собираюсь.
Ваш ответ ко мне я бы назвал по содержанию "техническим",  хотя я писал скорее о юридических и "политических" проблемах. Что не одно и то же.

Вы пишете о технических преимуществах одного формата перед другими как бы не видя других проблем с этим связанных.

Как будто не известны, хотя бы по делу Поносова, замашки прокуратуры искать врагов там, где их нет (стоят на страже интересов монополий империализма).

Поэтому я предлагал подготовиться во всеоружии к дэдлайн 1.1.2008.  

Если люди делают все тока для себя и для дома, то можно не беспокоиться, хотя воленс-ноленс проблема может начаться уже - в качестве предлога - с вашей ОС на десктопе или ноутбуке.

Здесь мое предложение - шифрование  дисков на уровне ОС, папок и файлов. То есть, шифруем жесткий диск уже при загрузке (всего то есть только 2 проги реальные: Disk Crypt Plus Pack, Whole Disk PGP.

Без пароля прокуратура внутрь вашего компа не попадет, даже если вынет диск из вашего компа, что не позволит вас осудить  (хотя может и неизвестно за что).

Продукцию на ДВД/ЦД следует зашифровать прогой CD (DVD) CRYPT. На входе опять  будет пароль, а так диск не прозрачен будет.

Так что проблему надо рассматривать целиком, а не тока тех. характеристики форматов.

И преде всего -- юридически. Поэтому,

1/ процитируйти плииз лицензию на использование кодировщиков, какие вы знаете, в отношении распространения изготовляемой продукции в djvu формате: есть ли ограничение по количеству страниц  для не-личного использования при создании файлов этим djvu  софтом и другие ограничения.

2/ Шрифты должны при этом быть использованы естессно только free.

Есть опасения, что существуют объективные трудности легализации изданий в этом формате.

С технической стороны вы не остановились на отсутствии (?) возможности использовать  трудноудаляемые watermarks в формате djvu.  

Не стоит возражать против Djvu как технически прогрессивного формата с отличными характеристиками по размеру файлов.  Весь вопрос только в легализации такой продукции таким софтом. У людей полно всякого софта для Djvu на руках, но как с легальностью произведенной продукции в этом формате и на этом софте для не-личного использования плииз?

Вы пишете, что "политика действительно дебильная, но для нас это не важно".
Почему же "не важно"? Первый и законный вопрос эксперта при распространении ваших собственных трудов: каким пользуетесь софтом? И что отвечать? Кста, версия 25 не открывается в софте для 22 версии --- к вопросу эксперта и проверки софта на валидность.

А что есть в наличии валидного для широкой публики, чтобы распространять свои труды? -

Реально получается только проекты minidjvu, DjVuLibre. Что, конечно же, неплохо, лучше, чем совсем ничего. У меня нет лицензии к такой старой проге как Solo, чтобы посмотреть, что там внутри лицензии, можно ли распространять копии для не-личного пользования. Это вопрос.

Кста, сами  эти проекты появились совершенно очевидно из-за реального правового геморроя с djvu, каким бы хорошим технически он ни был.

Отсюда и вывод о необходимости разделении "мух и котлет" --- технических и правовых вопросов.


Может быть, я не изощрен в производстве минимальных djvu  файлов, но мои tiff compressed group 4  -- факсимильный (факсовый) формат -- файлы в среднем в 2 раза больше djvu файлов, то есть, практически меньше или такого же размера как PDF (страница фолио tiff G4 в среднем 60 кб,  30 кб в Djvu). И никакого геморроя с авторскими правами ни на формат, ни на софт, ни на производство, ни на чтение, ни на распространение --- даже в сравнении с PDF, не говоря уже о Djvu. Причем, в сравнении с  PDF, при гипертекстовой интеграции в HTML файлы, что герморройно с PDF,  а в сравнении с DJvu - надежные watermarks (надо еще разобраться с возможностями или не-возможностями djvu с watermarks), 8-, 12-битное качество восстановленного текста. Формат TIFF = Public Domain.
Наверх
« Последняя редакция: 26.08.2007 :: 13:01:41 от romulus »  
 
IP записан
 
romulus
Новичок
*
Вне Форума


Всем привет!

Сообщений: 8
Re: Формат для автора, авторской публикации
Ответ #6 - 25.08.2007 :: 14:42:16
 
Эта тема не надумана, это вопрос менталитета.

Чувствуя это, приведу рассуждения студента, явно молодого человека, который  о с о з н а е т проблему и привожу адрес, где это лежит:

Тема: Как правильно сканировать лекции


""Это написано для среднестатистического студента МИРЭА (который весьма слабо представляет себе, что такое командная строка). Так что minidjvu исключается, а применять закрытое коммерческое ПО в образовании - плохой тон, и так уже у нас все подсели на MSOffice. В качестве альтернативы можно было бы самому написать указанный в тексте frontend, но в плане программирования я сейчас весьма занят.
ПО я в тексте указал - называется "minidjvu". Возможно, надо было ещё оставить ссылку на sourceforge.
Лицензия должна прилагаться в виде отдельного файла, либо быть включена в текст. По крайней мере, так написано в самой лицензии Улыбка. Зато теперь никто не сможет не заметить, что документ распространяется именно на условиях FDL, а не как-нибудь иначе. :-D""

http://mirea.org/forum/index.php?topic=9498.msg136872#msg136872

Комментировать нет смысла, но должно быть видно, что даже студентам лекции отсканировать и обработать коммерческим софтом нынче не в лом, не то что автору свои труды распространять. Когда даже студенты  друг с другом лекции с приложением какой то там лицензии FDL  п р и у ч е н ы  воленс-ноленс обмениваться (вот до чего дело дошло в России). И даже мелкософт нынче у студентов не в моде (последнее очень приятно)...  
Наверх
« Последняя редакция: 25.08.2007 :: 14:59:30 от romulus »  
 
IP записан
 
romulus
Новичок
*
Вне Форума


Всем привет!

Сообщений: 8
Re: Формат для автора, авторской публикации
Ответ #7 - 25.08.2007 :: 20:09:52
 
Формат DjvuLibre (свободный) и проект minidjvu надо, конечно, поддерживать --- для публикаций в интернете.

http://djvu.sourceforge.net/

http://djvu.org/

http://minidjvu.sourceforge.net/

Но авторы научных трудов и публикаций вовсе не заинтересованы в бесплатном тиражировании своих трудов в интернете. И в западном интернете вы не найдете ни одной научной статьи даром опубликованной в интернете.

Поэтому, чем труднее это сделать, тем авторам лучше.
Например, тиражировать столько CD,  сколько нужно.
А на CD уже не важно, сколько книжка занимает места, 20 или 40 Мб.

Буду, например, и впредь свои книги издавать в формате tifG4, сразу сканируя в нужный формат, редактируя в нем и потом восстанавливая 8-12 битное качество текста из 2-битного во вьюере.
И никакой головной боли!

Преимущество: Просмотрщик XnView - бесплатный вьюер для нужд образования и для всех мыслимых ОС --- BSD, Linux, OS2, Windows...
какие еще есть? - Есть для всех... И не чета Irfan'у.  
Наверх
 
 
IP записан
 
RuBorTeX
Новичок
*
Вне Форума


Всем привет!

Сообщений: 3
Re: Формат для автора, авторской публикации
Ответ #8 - 30.08.2007 :: 09:09:02
 
romulus писал(а) 25.08.2007 :: 20:09:52:
Но авторы научных трудов и публикаций вовсе не заинтересованы в бесплатном тиражировании своих трудов в интернете. И в западном интернете вы не найдете ни одной научной статьи даром опубликованной в интернете.

Может я Вас неправильно понял, но посмотрите на http://arxiv.org - все статьи в свободном бесплатном доступе и публикуются тоже бесплатно. Развитие науки заинтересовано в динамичном обмене информацией, а вовсе не в её утаивании. И проблем с копирайтами не возникает, т.к. для публикаций используется LaTeX/PDFLaTeX, имеющие богатейший выбор свободных в использовании шрифтов.

Кстати, и форматом JPEG в И-нете можно пользоваться свободно - все вопросы с лицензированием уже решены. Так что не нужно придумывать несуществующие проблемы.
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
Вне Форума


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5570
Екатеринбург
Пол: male
Re: Формат для автора, авторской публикации
Ответ #9 - 30.08.2007 :: 10:46:43
 
RuBorTeX писал(а) 30.08.2007 :: 09:09:02:
Развитие науки заинтересовано в динамичном обмене информацией, а вовсе не в её утаивании. И проблем с копирайтами не возникает...

Я бы поспорил насчет этого постулата Улыбка Делают науку конкретные люди, которым кушать хочется как и прочим, а спонсоры или бюджет - все едино научного результата требуют. Если его можно получить бесплатно в интернете, зарплату данному человеку спонсор(бюджет) платить уже не будет. Я утрирую, но разве не так? arxiv.org не есть вся научная информация, сгенерированная в мире.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
RuBorTeX
Новичок
*
Вне Форума


Всем привет!

Сообщений: 3
Re: Формат для автора, авторской публикации
Ответ #10 - 30.08.2007 :: 19:18:31
 
Ну, это не постулат... И я не спорю, что развитие науки и зарабатывание денег (славы и т.п.) порой конфликтуют.
AAW писал(а) 30.08.2007 :: 10:46:43:
arxiv.org не есть вся научная информация, сгенерированная в мире.

Так я этого и не утверждал. Просто удивило заявление "в западном интернете вы не найдете ни одной научной статьи даром опубликованной в интернете". Только на "архиве" можно найти более 400 тыс. таких статей. Причём публикуются там и учёные с мировым именем.

Вообще немного удивляеют предложения автора темы. То ли он хочет популяризировать свои публикации, то ли наоборот сделать так, что публикация как бы и есть, но доступ к ней в неудобном виде. Опять же не очень понятна связка "автор - OCR (тематика форума) - TIFF". У автора вроде как должны быть исходные тексты, не нуждающиеся в OCR. С другой стороны, в качестве выходного формата предлагается TIFF, для генерации которого OCR не требуется.
Наверх
 
 
IP записан
 
Переключение на Главную Страницу Страниц: 1
Послать Тему Печать