OCR форумы Добро пожаловать, Гость. Пожалуйста, выберите Вход или Регистрация
Форум переведен из кодировки UTF-8 в кодировку WINDOWS-1251. По всем вопросам, связанным с кодировкой текста (появлением «кракозябр»), обращайтесь к Администратору.
The forum is translated from the UTF-8 encoding to the WINDOWS-1251 encoding. For all questions related to the encoding of the text (the appearance of 'krakozyabr'), please contact the Administrator.
 
  ГлавнаяСправкаПоискВходРегистрация Администратор Библиотека  
 
Страниц: 1 2 
Послать Тему Печать
Сайт на букву F или шаг вперед и три назад (Прочитано 27069 раз)
Lykas
Гуру
****
Вне Форума


Всем привет!

Сообщений: 673
Сайт на букву F или шаг вперед и три назад
02.04.2005 :: 00:39:05
 
Любители фантастики, обитающие в сети, могут квалифицировать электронные библиотеки:
1.  по удобности работы -
      удобные -доступ к файлам напрямую, по ссылкам.
      не удобные - обьяснять не буду, попробуйте сами fenzin.org
2. по объему информации  - небольшие, не ставящие своей целью собрать всю фантастику, но собирающие
      всю информацию об авторе, а не только книги.
      глобальные - сайт Русская фантастика                                 
Может быть я такой привередливый, но я хочу зайти на сайт, скачать новые книги за 10-15 минут и получать удовольствие от свежей книги. Может я не прав, и это все делается для моего блага.
Наверх
 
 
IP записан
 
Slawa-614
Активист
***
Вне Форума


Всем привет!

Сообщений: 380
Пол: male
Re: Сайт на букву F или шаг вперед и три назад
Ответ #1 - 02.04.2005 :: 01:07:10
 
Lykas писал(а) 02.04.2005 :: 00:39:05:
1.  по удобности работы -
      удобные -доступ к файлам напрямую, по ссылкам.
      не удобные - обьяснять не буду, попробуйте сами fenzin.org


  Провайдер хочет денег (за трафик), сам сервер - тоже денег стоит, ну и по мелочи - свет, "газ", помещение... Это без учета добровольно-бесплатного участия оцифровщиков, корректоров, админов и собирателей коллекций, работающих на голом энтузиазме. Да еще поборы от лиги адвокатов, РОМС и пр. "защитников", якобы обязующихся улаживать копирайтные дела (хотя на деле М.Максима они так и не защитили, а ведь он ежемесячно отстегивал РОМСу).
  Откуда денег брать, если библиотека для пользователей - бесплатна? Только из рекламных банеров. Литпортал или Альдебаран видел? Чтобы взять книгу - нужно сначала продраться через 3 страницы рекламы (а за каждые 100 кликов - теоретически держателю библиотеки капает несколько копеек). Больше рекламы - меньше народу захочет сквозь нее продираться, значит упадет рейтинг и 100 кликов  подешевеют. Меньше поставишь - выше удобства, но... расходы не окупишь, придется свои деньги вкладывать.
  Вот и изголяются - кто как может.
  У Фэнзина рекламы мало, но он на РОМС-е экономит. Файлов то на сервере нет, они где-то зарубежом лежат.
  А Русская Фантастика - нет ни РОМСа, ни рекламы - потому что выкладывается только разрешенное авторами. Доступ быстрый и удобный, а толку то? Самих файлов нет. Последние 2 года - только мелкие рассказы да интервью с литобзорами, из-за которых никто шума поднимать не будет.

  Так что лучше?
Наверх
 

Slawa-614
 
IP записан
 
Ustas
Постоялец
**
Вне Форума


даешь качественный OCR!

Сообщений: 176
Пол: male
Re: Сайт на букву F или шаг вперед и три назад
Ответ #2 - 03.04.2005 :: 22:48:34
 
я так думаю, что такая удлиненная схема скачки еще и для сдерживания массированных сливов всей библио....
Траффик, чай, денег стоит.
Наверх
 
WWW 67730822  
IP записан
 
SG
Новичок
*
Вне Форума


Всем привет!

Сообщений: 3
Re: Сайт на букву F или шаг вперед и три назад
Ответ #3 - 18.06.2005 :: 17:24:28
 
Даааа... далеко пойдете! Оба! Не удивлюсь, если Вы оба из Москвы, очень похоже!

"Провайдер хочет денег (за трафик), сам сервер - тоже денег стоит,...."
С этим все и так давно уже ясно все - нужен хостинг где-нибуть в Китае (абсолютсо серьездно)

"Откуда денег брать, если библиотека для пользователей - бесплатна? Только из рекламных банеров. Литпортал или Альдебаран видел? Чтобы взять книгу - нужно сначала продраться через 3 страницы рекламы (а за каждые 100 кликов - теоретически держателю библиотеки капает несколько копеек). Больше рекламы - меньше народу захочет сквозь нее продираться, значит упадет рейтинг и 100 кликов  подешевеют. Меньше поставишь - выше удобства, но... расходы не окупишь, придется свои деньги вкладывать.
  Вот и изголяются - кто как может. "


Точно Slawa, точно! А еще можно по-другому изголяться, как Вы например...
Отлавливать в RU.OCR сообщения о новых сканах, их адреса, перекачивать самые, на Ваш взгляд интересные, на всой ресурс и ... пользуясь своим "служебным положением" рекламировать его с "Вашими" новыми поступлениями, совершенно забывая про интересы сканирующего...

А ведь Он (сканирующий) время потратил на обработку, деньги за хостинг отвалил, на закачку файлов и все бесплатно умыкнули Вы...

А теперь вопросы в студию!
Где правда? На чьей стороне? Вы считаете, что можно так нагло себя вести?
Да? Тогда давайте представим, что Я скопирую все  Ваши сканы на свой сайт по средством SSH Улыбка
Кто-то у меня и т.д. Что будет? Правильно! Ничего хорошего!

Поэтому - выношу Вам официальное предупреждение! Будте честны перед Всеми!  У НАС никогда ничего толкового не выйдет если каждый будет думать как заработать, надо думать как сделать все наилучшим образом и никого не обидеть!
[size=12][/size]
Наверх
 
 
IP записан
 
Slawa-614
Активист
***
Вне Форума


Всем привет!

Сообщений: 380
Пол: male
Re: Сайт на букву F или шаг вперед и три назад
Ответ #4 - 18.06.2005 :: 18:53:20
 
SG писал(а) 18.06.2005 :: 17:24:28:
Даааа... далеко пойдете! Оба! Не удивлюсь, если Вы оба из Москвы, очень похоже!


  Уже идем и давно, что самое забавное.

SG писал(а) 18.06.2005 :: 17:24:28:
"Провайдер хочет денег (за трафик), сам сервер - тоже денег стоит,...."
Точно Slawa, точно! А еще можно по-другому изголяться, как Вы например...
Отлавливать в RU.OCR сообщения о новых сканах, их адреса, перекачивать самые, на Ваш взгляд интересные, на всой ресурс и ... пользуясь своим "служебным положением" рекламировать его с "Вашими" новыми поступлениями, совершенно забывая про интересы сканирующего...


  Опа! Ошибочка тут. Я не самое интересное скачиваю, я скачиваю абсолютно все. И неинтересное - тоже.
Только вот беда - "своего ресурса" у меня нет (ну если не считать очень специфичную "www.rusf.ru/books", куда это "интересное" выкладывать нельзя по дефолту).

SG писал(а) 18.06.2005 :: 17:24:28:
А ведь Он (сканирующий) время потратил на обработку, деньги за хостинг отвалил, на закачку файлов и все бесплатно умыкнули Вы...


Разве? Вот уж не знал. Странно, почему же те же оцифровщики, из RU.OCR, все ссылки на свои сканы еще и на E-Mail присылают? Мне казалось - чтоб не забыл и не пропустил... Выходит, и тут ошибался...

SG писал(а) 18.06.2005 :: 17:24:28:
А теперь вопросы в студию!
Где правда? На чьей стороне? Вы считаете, что можно так нагло себя вести?


Про "нагло" - это да. Тут в самую точку. Можно, я это вырежу и оцифровщикам покажу? Можно? Спасибо.

SG писал(а) 18.06.2005 :: 17:24:28:
Да? Тогда давайте представим, что Я скопирую все  Ваши сканы на свой сайт по средством SSH Улыбка
Кто-то у меня и т.д. Что будет? Правильно! Ничего хорошего!


Я не знаю - кто такой SSH и чем он знаменит, но не получится однозначно. Зуб даю. Файлы то того... Не в доступе. Проще на CD переписать. DVD - 3 штучки, как раз влезут.

SG писал(а) 18.06.2005 :: 17:24:28:
Поэтому - выношу Вам официальное предупреждение! Будте честны перед Всеми!  У НАС никогда ничего толкового не выйдет если каждый будет думать как заработать, надо думать как сделать все наилучшим образом и никого не обидеть!


За предупреждение - спасибо, предупрежден - значит вооружен. Помещу его на самое видное место, между письмами от KM.RU. Кстати, Вы сами то не из этой ли конторы?

А по поводу копирования моих сканов - буду только благодарен. А то как то все на самотек пущено. Вон вчера узнал - моя коллекция уже по Питеру расходится со страшной силой, а я и не в курсе:
http://palmz.4to.info/showthread.php?t=21677&page=1
Причем, самое обидное - распространяют версию, устаревшую на 800 мег, а то и на целый гиг. Непорядок.

Да, и еще - какой именно Ваш скан я украл? Будьте так добры - назовите. Немедленно прибью его у себя, да и всем знакомым посоветую - убрать с доступа.
Ибо не зачем такой тяжкий труд людям давать. Пусть уж лучше в корзине для мусора лежит.

Кстати, и Юру Котилевского (модератора RU.OCR) нужно будет известить - незачем нам ссылки на сканы, которые читать запрещено. Особенно под страхом официального предупреждения.
Наверх
 

Slawa-614
 
IP записан
 
Ustas
Постоялец
**
Вне Форума


даешь качественный OCR!

Сообщений: 176
Пол: male
Re: Сайт на букву F или шаг вперед и три назад
Ответ #5 - 18.06.2005 :: 22:39:15
 
SG писал(а) 18.06.2005 :: 17:24:28:
А ведь Он (сканирующий) время потратил на обработку, деньги за хостинг отвалил, на закачку файлов и все бесплатно умыкнули Вы...

Дикость какая-то....
Вы что же, думаете нажиться на ворованных по теперешнему законодательству текстах, и поэтому предъявляете претензии?
Траффик, хостинг....
Детство какое-то.
AFAIK, порядочные библиотекари уважают чужой труд (сканщиков, читальщиков) и блюдут все ссылки, если они есть в исходных текстах...
(Бомануар, Мошков, Литпортал, Ершов, Альдебаран.....продолжать?)

А ежели есть у Вас конкретные претензии - дык названия файлов в студию!
Вроде как общим делом заняты, а тут еще "авторское право" на тыренные у автора тексты придумывают
(или я ошибаюсь?)

Наверх
 
WWW 67730822  
IP записан
 
SG
Новичок
*
Вне Форума


Всем привет!

Сообщений: 3
Re: Сайт на букву F или шаг вперед и три назад
Ответ #6 - 19.06.2005 :: 12:59:11
 
Таким образом, если я Вас правильно понял, я могу купить хостинг или арендовать сервер где-нибуть подальше  (чтобы авторы не достали) скопировать туда все Ваши, Слава, сканы банерочков понавешать, рекламки всякой и иметь свой, пусть небольшой, но заработок. Это честно по Вашему? Честно?

Ну так вот, поясняю свои слова... Я говорю о том, что большинство OCRщиков имеют свою специализацию, кто-то по электронике книги сканирует, кто-то фантастику преимущественно, какая-то облать интересов просматривается в любом случае, согласны?
Тогда дальше, вид деятельности определяется целями, если цели самые благородные - то никакой рекламы, только свои сканы или добровольно присланные сканы, естественно. Это идеал, это - люди-филантропы., их я уважаю, они самодостаточны и уверены в себе, чтобы удержаться от соблазна простого копирования, вместо ссылки.

Но Я, например, сканирую потомучто, во-первых, мне нравится темы и содержания книг (в основном по электронике) , а ,во-вторых,  потомучто хочу привлечь людей к общению на данные темы, обмену опытом, создания чего-то нового (не толко же повторять опыт предыдущих поколений).

Одним словом,  каждый самореализуется по своему, и я думаю каждый хочет получить какое-то вознаграждение за свой туд... Ясное дело, деньги тут не причем, но общение на тему...какое-то уважение, признательность... почему бы нет? А Вы ребята, по моему мнению, своим отношением этому мешаете... Вот например, ScanPirat лепит свои эксклибрисы на отсканеные книги,  не знаете почему? А думаю, что это его цена за книгу, скромная слава, если хотите! И это его право!  Я с ним полностью согласен! Потомучто зная этот эксклибрис можно попытаться найти еще книги на подобную тему, и это хорошо для пользователя!

Поэтому призвываю: давайте честно создавать электронные библиотеки, увидели понравившуюся книгу у кого-нибудь - поставили ссылку на ресурс-источник, скачали себе. Все довольны! И Вы "пополнили" свою коллекцию (причем совершенно законно, файл-то не у Вас и место на хостинге сэкономили), и прибавили посетителей на ресурс коллеги.
А вот если на первоисточнике ссылка загнулась и обновить ее никаких возможностей нет, то Ваше право - выкладывайте файл! Понимаю, геморой страшный, но если подумать в прогрессии на пару десятков шагов вперед, думаю, самый правильный, честный, прогрессирующий, но при этом и самый сложный путь.

А то зайдешь в е-библиотеку, а там одно и тоже, друг и друга передирают, а "своих" пару книг, это правильно? Для Вас, создатели, может и правильно (времени на создание уходит куда меньше), а для пользователя? Обновления идут малыми темпами, большинство только потребляют, а сканировать не хотят, даже если имееют возможность.

И на счет дисков - я только за  сам относительно недавно получил более менее постоянный доступ в Инет, не имею возможности скачать многие книги, поэтому я ЗА диски, но они должны распространяться бесплатно или с минимальными затратами на тех. издержки. Мы и так нарушаем права авторов, не хватает еще усугубить всю ситуацию зарабатыванием денег на этом!

Удачи!
Наверх
 
 
IP записан
 
Ustas
Постоялец
**
Вне Форума


даешь качественный OCR!

Сообщений: 176
Пол: male
Re: Сайт на букву F или шаг вперед и три назад
Ответ #7 - 19.06.2005 :: 20:54:27
 
мне так казалось, что все участники данного форума - энтузиасты (филантропы?).
Не токмо ради денег, а просто хобби такое....

И ссылки блюдут, а если чего и забыли - так напомните адресно - завсегда поправят.
И будете Вы иметь свои 5 минут славы. (гы, интересный каламбурчик)

Видимо, тут имеет место быть непонимание (обида) на пропавшую (вполне допускаю при теперешних объемах) несознательно ссылку на источник.
Вроде все правильно сказали - а чего обижаетесь, укажите конкретный пример, если Вас обидели - поправятся...

И очень Вы правильно все сказали, так ведь тут и пытаются собрать OCR форум - присоединяйтесь, дело-то общее, какая разница где будут лежать тексты - если ссылки соблюдены, так ведь все равно...
А так - Вы бы могли поделиться здесь своим опытом.
Мне близка Ваша позиция касательно специализации - сам грешен, на авантюрную беллетристику прошлых веков запал. А по образованию - радиоинженер. Так давайте и пообщаемся  Подмигивание

ЗЫ И касательно дисков (каких именно?), AFAIK они распространяются совершенно бесплатно, но не для любого желающего.

ИМХО
Наверх
« Последняя редакция: 19.06.2005 :: 21:00:47 от Ustas »  
WWW 67730822  
IP записан
 
Slawa-614
Активист
***
Вне Форума


Всем привет!

Сообщений: 380
Пол: male
Re: Сайт на букву F или шаг вперед и три назад
Ответ #8 - 19.06.2005 :: 23:02:24
 
SG писал(а) 19.06.2005 :: 12:59:11:
Таким образом, если я Вас правильно понял, я могу купить хостинг или арендовать сервер где-нибуть подальше  (чтобы авторы не достали) скопировать туда все Ваши, Слава, сканы банерочков понавешать, рекламки всякой и иметь свой, пусть небольшой, но заработок. Это честно по Вашему? Честно?


Да за ради Бога. А я вот и хотел бы, да не могу своих фидошных файл-эхах всякие баннерочки распространять. Потому что реклама в ФИДО запрещена как класс.

SG писал(а) 19.06.2005 :: 12:59:11:
А Вы ребята, по моему мнению, своим отношением этому мешаете... Вот например, Scan Pirat лепит свои эксклибрисы на отсканеные книги,  не знаете почему? А думаю, что это его цена за книгу, скромная слава, если хотите! И это его право!  Я с ним полностью согласен! Потомучто зная этот эксклибрис можно попытаться найти еще книги на подобную тему, и это хорошо для пользователя!


Кстати, при случае - передай привет Pirat-у, от меня.

P.S. Он сегодня как раз очередную книжку выложил. Правда, совсем не радиотехнику.


Наверх
 

Slawa-614
 
IP записан
 
SG
Новичок
*
Вне Форума


Всем привет!

Сообщений: 3
Re: Сайт на букву F или шаг вперед и три назад
Ответ #9 - 20.06.2005 :: 14:34:57
 
U>И очень Вы правильно все сказали, так ведь тут и пытаются собрать OCR форум - присоединяйтесь,
U>дело-то общее, какая разница где будут лежать тексты - если ссылки соблюдены, так ведь все равно...

Так вот как раз и не все равно... Какой смысл в тупом сканировании книг и собирании их в одной (несколькихУлыбка библиоткеке! Это - глобализм, а я, как любитель свободы, -  антиглобалист. Интересно много ли Вы книг из всех скаченных Вами прочитали? Вот Слава говорит 3ДВД - у меня есть купленные 4ДВД, так я оттуда если штук 30 пробежал взглядом во время написания различного рода статей, то это хорошо!
Я за множество разнообразнейших библиотек, я за выбор, короче, за выбор из многообразия, а не из одного и того же... За общение, за взаимодействие, за ЧЕСТНОСТЬ в отношениях между OCRщиками...

А на счет пообщаться, форумы - не моя стихия (слишком накладно по деньгам, да и правды от ВАС не добьешься), я аську предпоситаю, мыло, и это - мое последнее сообщение сдесь (радуйтесь, я уже все что меня интересовало выяснил)

S>Да за ради Бога. А я вот и хотел бы, да не могу своих фидошных файл-эхах всякие баннерочки
S>распространять. Потому что реклама в ФИДО запрещена как класс.

Я потому и начал этот мммм.. базар (сорриУлыбка, что Вы "хотели бы"!
И если человек выбросил в Ру.ОЦР место и название отсканеной книги, то соблюдайте плз ссылки на него в дальнейшем.

Прощайте!
Наверх
 
 
IP записан
 
Dauphin
Новичок
*
Вне Форума


из подполья...

Сообщений: 22
Lugansk, Ukraine
Пол: male
Re: Сайт на букву F или шаг вперед и три назад
Ответ #10 - 22.06.2005 :: 08:03:55
 
Slawa-614 писал(а) 18.06.2005 :: 18:53:20:
Кстати, и Юру Котилевского (модератора RU.OCR) нужно будет известить - незачем нам ссылки на сканы, которые читать запрещено. Особенно под страхом официального предупреждения.

Я, собственно, здесь. И если честно, "нич-чиго не понимаю" (c). Об чем речь? Люди для того и дают ссылки (в RU.OCR в том числе), чтобы сделанные ими файлы как можно шире разошлись. Или не так? Или кто-то специально убирает подписи оцр-щиков, те самые экслибрисы, которые обычно внутрях файла находятся? Примеры в студию, пожалуйста.
Наверх
 

С уважением, Dauphin
 
IP записан
 
Slawa-614
Активист
***
Вне Форума


Всем привет!

Сообщений: 380
Пол: male
Re: Сайт на букву F или шаг вперед и три назад
Ответ #11 - 22.06.2005 :: 15:00:01
 
Dauphin писал(а) 22.06.2005 :: 08:03:55:
Я, собственно, здесь. И если честно, "нич-чиго не понимаю" (c). Об чем речь? Люди для того и дают ссылки (в RU.OCR в том числе), чтобы сделанные ими файлы как можно шире разошлись. Или не так? Или кто-то специально убирает подписи оцр-щиков, те самые экслибрисы, которые обычно внутрях файла находятся? Примеры в студию, пожалуйста.


Честно говоря, я тоже не понял - за что на меня SG наехал. Вроде бы скачал по ссылке из RU.OCR чей-то скан и, запустив его в файл-эху, круто на нем нажился. Но просьба - указать, какой именно скан - осталась без ответа.
Я пускаю в фэхи файлы в том виде - как они есть. А если внутри скана нет ссылок на исходный ресурс или ника оцифровщика - то что я могу сделать? Я же не могу встроить письмо из эхи в djvu-шку (да и то письмо к моменту отправки скана в фэху - как правило уже прибито за давностью срока). С другой стороны - ссылка в общей эхе - только для распространения и ни для чего более (да еще некоторые оцифровщики - дублируют письмом на E-Mail). В принципе - это первая претензия, но я пока не понял - от кого именно, за какой файл (ссылку).


P.S. Еще позабавила ссылка на Pirat-а: SG (или все же Г.Ш.?) поставил мне его в пример, как самого бескорыстного оцифровщика. Я вроде бы знаю Pirat-а лично. Он ни разу не возражал против постинга сканов в фидошные фэхи и на любые сайты - тоже.
Наверх
 

Slawa-614
 
IP записан
 
Dauphin
Новичок
*
Вне Форума


из подполья...

Сообщений: 22
Lugansk, Ukraine
Пол: male
Re: Сайт на букву F или шаг вперед и три назад
Ответ #12 - 23.06.2005 :: 07:46:15
 
Slawa-614 писал(а) 22.06.2005 :: 15:00:01:
P.S. Еще позабавила ссылка на Pirat-а: SG (или все же Г.Ш.?) поставил мне его в пример, как самого бескорыстного оцифровщика. Я вроде бы знаю Pirat-а лично. Он ни разу не возражал против постинга сканов в фидошные фэхи и на любые сайты - тоже.
Очень довольный Я тоже знаю Pirat'а, хоть и не так хорошо, как ты Подмигивание Мне вот некий Dauphin ближе известен... Класс
Наверх
 

С уважением, Dauphin
 
IP записан
 
Gautier
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 154
Re: Сайт на букву F или шаг вперед и три назад
Ответ #13 - 19.10.2005 :: 16:57:18
 
Dauphin писал(а) 22.06.2005 :: 08:03:55:
Или кто-то специально убирает подписи оцр-щиков, те самые экслибрисы, которые обычно внутрях файла находятся? Примеры в студию, пожалуйста.

Позволюте в разговор встрясть, хотя ничего как следует не понял. Даёшь пример на представленную цитату!
Только что обнаружил в "Альдебаране" версию "Моби Дика" Мелвилла, по виду новую. Взял оттуда их RTF. Впереди там, как многие любят, картинка - обложка книги 2005 г. (изд-во какая-то там "Азбука"). Кто выполнил OCR - не указано. Однако я знаю, что "Моби Дика" сканировал Сергей Петров где-то в 1999-2000, и у меня версии есть. Ну, проверил по своей "Методике после OCR" систематические ошибки OCR (в частности, точки в ненужном месте - впереди букв) - все ошибки старой версии и альдебарановой - одни и те же. Похерили они там С. Петрова, да еще чтобы муть напустить обложку посл. издания добавили.
И это нехорошо, друзья. Полагаю, что приведенный пример не единичен. Наверное, что-то подобное и у вас там выше вышло, хотя ничего в тех баннерах-хренанерах я не понял (надо будет разобраться на досуге, вот только нет его). Понял только, что среди мастеров OCR держащие-пополняющие свои библиотеки за счет версий других авторов есть. Можно и так, ничего страшного, особенно если поправить-улучшить (я так делаю, но посылаю Ершову - нет у меня баннера, хотя Интернет пока бесплатный и беслимитный). Но лейбл первого мастера снимать - это малокультурно. Злой
Наверх
 
 
IP записан
 
Zmiy
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 106
Минск
Пол: male
Re: Сайт на букву F или шаг вперед и три назад
Ответ #14 - 19.10.2005 :: 17:16:15
 
Книги на Альдебаране и ФикшБук оформляют добровольцы. Если они берут исходные тексты незнамо где (например из своих запасов где удалено все кроме текста), то откуда же возникнет доп.информация. Они же не хотят рыскать по Интернету и искать афторов...
Наверх
 

http://zpdd.chat.ru - Сканирование литературы
WWW  
IP записан
 
Antikwar
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 78
Москва
Пол: male
Re: Сайт на букву F или шаг вперед и три назад
Ответ #15 - 19.10.2005 :: 17:44:15
 
Gautier писал(а) 19.10.2005 :: 16:57:18:
Только что обнаружил в "Альдебаране" версию "Моби Дика" Мелвилла, по виду новую. Взял оттуда их RTF. Впереди там, как многие любят, картинка - обложка книги 2005 г. (изд-во какая-то там "Азбука"). Кто выполнил OCR - не указано. Однако я знаю, что "Моби Дика" сканировал Сергей Петров где-то в 1999-2000, и у меня версии есть. Ну, проверил по своей "Методике после OCR" систематические ошибки OCR (в частности, точки в ненужном месте - впереди букв) - все ошибки старой версии и альдебарановой - одни и те же. Похерили они там С. Петрова, да еще чтобы муть напустить обложку посл. издания добавили.

Все не так плохо и, вместе с тем, все гораздо хуже. Улыбка Дело в том, что в библиотеках, основаных на формате fb2, книги в этом формате и хранятся. А у этого формата есть так называемый дескрипшн, в котором и хранится вся информация о книге. В том числе: Автор документа (кто готовил fb2-файл, OCR (кто сканировал), source OCR (откуда скачан оригинал) и история создания документа (сканирование, вычитка, сколько раз вычитан, кем и т.д.) В принципе очень удобно - и максимум информации, и читать не мешает, и не удалят. Но! Когда качают файл в другом формате (а fb2 дает для этого прекрасные возможности), то вся служебная информация, хранящаяся в дескрипшене, попросту убивается. Причем, в конвертере присутствует возможность сохранять данную информацию, но владельцы данных библиотек считают, что простому пользователю это не нужно, а кому нужно, тот пускай fb2 качает. Сейчас Ustas придет и все выскажет - он давно по этому поводу с ними общается. Улыбка

Цитата:
Но лейбл первого мастера снимать - это малокультурно. Злой

Возможно, конечно, что имя было убито случайно. Или документ попал к создателю fb2 файла через третьи руки с уже убитыми данными. Вряд ли кто-то намеренно удалит информацию. Но весь трагизм ситуации в том, что в fb2 библиотеки файлы заливать может практически кто угодно. Главное, чтобы файл был грамотно сделан, а грамотность (валидность) файла проверяется программой-валидатором. С одной стороны удобно, а с другой... Многим просто лень заполнять дескрипшн. То есть, там есть обязательные для заполнения поля - без них файл не пройдет. Но поле OCR не обязательное - ведь источника может и не быть (авторский текст) или он может быть не известен.

Если произошла такая ерунда, то может стоит написать туда, чтобы хоть дескрипшн у fb2-файла поправили?

PS. Пошел, посмотрел, дейсвительно:
Документ подготовил(и):  Roland
Номер версии документа: 1.0
Язык документа: ru
Создан с использованием: FB Tools
Дата создания документа: 2005-10-08
Основано на издании: Моби Дик, или Белый Кит, Москва, Азбука-классика, 2005, ISBN 5-352-01431-2

Тем не менее, в отсканированных мной и выложенных на данном форуме книгах после того, как их кто-то залил на Альдебаран, все "служебные" данные сохранены.
Наверх
 
 
IP записан
 
Gautier
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 154
Re: Сайт на букву F или шаг вперед и три назад
Ответ #16 - 20.10.2005 :: 12:30:56
 
Zmiy писал(а) 19.10.2005 :: 17:16:15:
Книги на Альдебаране и ФикшБук оформляют добровольцы. Если они берут исходные тексты незнамо где (например из своих запасов где удалено все кроме текста), то откуда же возникнет доп.информация. Они же не хотят рыскать по Интернету и искать афторов...

Вот это да! Оправдываешь то, что никакому оправданию не поддается. Это, знаешь, чересчур. К примеру, в Интернете полно версий "Моби Дика", и всюду указано, что выполнил их С. Петров. Пять минут поиск их занимает. Ясно, что отсутствие лейбла Петрова в "Альдебаране" и новая обложка - не просто так. Наверное, какие-то свои интересы соблюдают.
Всему должен быть предел, в том числе и беззаконию. Сам знаешь, что такое выполнить OCR на триста с лишним страниц DOC (RTF). Лейбл такого мастера надо указывать.
Наверх
 
 
IP записан
 
Zmiy
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 106
Минск
Пол: male
Re: Сайт на букву F или шаг вперед и три назад
Ответ #17 - 20.10.2005 :: 13:44:53
 
Ну лежит на Альдебаране "Две Дианы" Дюма, которые делал я, а написано - "Информация об издании отсутствует". Так еще ж и обложка левая. Да там в биб-ке половина обложек левые.
Я Альдебарану об этом говорил, он проигнорировал замечание. Ну и что я могу сделать?
Наверх
 

http://zpdd.chat.ru - Сканирование литературы
WWW  
IP записан
 
Antikwar
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 78
Москва
Пол: male
Re: Сайт на букву F или шаг вперед и три назад
Ответ #18 - 20.10.2005 :: 16:23:18
 
Насчет левых обложек... Файл готовит доброволец. Без обложки "некрасиво" тем более, что в прогаммах-библиотекарях эта обложка отображается, вот и ищет человек на всяких "Озонах" обложечку к книге. А то, что OCR вовсе не по этому изданию готовится... Человек сделал книжку, быть может первую, и радуется - принес пользу обществу. Может, если ему мягко сказать, что это не совсем правильно и объяснить, как надо...

PS. Сегодня на форуме Фикшнбука была создана спец. ветка, куда можно постить сообщения о всяких "неправильностях" в книгах.
Наверх
 
 
IP записан
 
Ustas
Постоялец
**
Вне Форума


даешь качественный OCR!

Сообщений: 176
Пол: male
Re: Сайт на букву F или шаг вперед и три назад
Ответ #19 - 20.10.2005 :: 20:59:08
 
Antikwar писал(а) 20.10.2005 :: 16:23:18:
PS. Сегодня на форуме Фикшнбука была создана спец. ветка, куда можно постить сообщения о всяких "неправильностях" в книгах.


Собственно, к OCR такая ветка отношения не имеет.
В ней речь идет только о криво сделанных ебучных файлах.
И если я буду писать о ебуках с неправильными/отсутствующими выходными данными, левыми обложками - придется переписать 4/5 тамошней библиотэки.
Ты же в курсе отношения аффтора формата/админов библиотеки к библиографии?
Плевать там всем на данные оригинала.
Тест есть, валидацию прошел - и славно, 99% читающего Рунета довольны  Нерешительный

ИМХО
Наверх
 
WWW 67730822  
IP записан
 
Antikwar
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 78
Москва
Пол: male
Re: Сайт на букву F или шаг вперед и три назад
Ответ #20 - 21.10.2005 :: 10:27:20
 
Ustas писал(а) 20.10.2005 :: 20:59:08:
Собственно, к OCR такая ветка отношения не имеет.
В ней речь идет только о криво сделанных ебучных файлах.

Ну, это в любом случае прогресс. Хотя бы опечатки поправят. Может быть...

Цитата:
Ты же в курсе отношения аффтора формата/админов библиотеки к библиографии?
Плевать там всем на данные оригинала.
Тест есть, валидацию прошел - и славно, 99% читающего Рунета довольны  Нерешительный

И да и нет. Надо на мозги капать. То есть, большинству пользователей - пофиг. Но они же (пользователи) не против? Надо только, чтобы не один-два человека об этом говорили. Да и на данные оригинала там народу не  совсем плевать: все же призывы максимально заполнять дескрипшн звучат постоянно.
По крайней мере я собираюсь туда писать о книжках с плохо заполненным дескрипшеном. До последней капли крови. Улыбка Может и толк какой-то будет...
Наверх
 
 
IP записан
 
Fenzin
Новичок
*
Вне Форума


Всем привет!

Сообщений: 4
Re: Сайт на букву F или шаг вперед и три назад
Ответ #21 - 27.10.2005 :: 14:58:50
 
Меня улыбнуло.  Смех

Поскольку первый пост был про фантастику, то выскажусь. За год ЛИЧНО мной сделано более 300 сканов. В неделю сканируется 5-7-10 книг. Какие комментарии еще нужны?

Сравните сколько было отсканировано удобными библиотеками Альдебаран и Фикшнбук за такой же промежуток.
Наверх
 
 
IP записан
 
Ustas
Постоялец
**
Вне Форума


даешь качественный OCR!

Сообщений: 176
Пол: male
Re: Сайт на букву F или шаг вперед и три назад
Ответ #22 - 27.10.2005 :: 15:10:45
 
А Фикшенбук - не OCR библиотека, afaik
Наверх
 
WWW 67730822  
IP записан
 
Antikwar
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 78
Москва
Пол: male
Re: Сайт на букву F или шаг вперед и три назад
Ответ #23 - 27.10.2005 :: 15:36:16
 
Мне кажется, что некое разделение труда - это хорошо. То есть, мне было бы приятней, если бы в сети было побольше тематических библиотек. Пусть они и не занимаются собственно сканированием.

PS. Если сканировать по книжке в день (что реально), то когда их вычитывать?  Ужас
Наверх
 
 
IP записан
 
Fenzin
Новичок
*
Вне Форума


Всем привет!

Сообщений: 4
Re: Сайт на букву F или шаг вперед и три назад
Ответ #24 - 27.10.2005 :: 15:40:31
 
Сканировать реально по книжке в час. Также реально делать по шесть книг в день (как раз три фильма успеваю посмотреть). Вычитывают другие. Вычитывать все это мне самому - никакого времени не хватит. Да и средний уровень всех этих книг...
Наверх
 
 
IP записан
 
Antikwar
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 78
Москва
Пол: male
Re: Сайт на букву F или шаг вперед и три назад
Ответ #25 - 27.10.2005 :: 16:14:57
 
Fenzin писал(а) 27.10.2005 :: 15:40:31:
Сканировать реально по книжке в час. Также реально делать по шесть книг в день (как раз три фильма успеваю посмотреть).

Ну, для меня "по книжке в день" - после работы. Улыбка Так что с вычиткой "по книжке в неделю" получается. В лучшем случае.

Цитата:
Вычитывают другие.

Здорово! Проблема у меня в том, что хотя иногда удается найти добровольцев для повторной вычитки (иногда меня потом бьют), то далеко не для всех произведений. Кто добровольно согласится вычитывать "избранные мысли брата Шарля от Иисуса" или же одну полусамиздатовскую книжку "Потерянная драхма"? (Это из того, что я недавно сканировал.)
Наверх
 
 
IP записан
 
amyatishkin
Активист
***
Вне Форума


Всем привет!

Сообщений: 426
Re: Сайт на букву F или шаг вперед и три назад
Ответ #26 - 27.10.2005 :: 17:26:31
 
Fenzin писал(а) 27.10.2005 :: 15:40:31:
Сканировать реально по книжке в час. Также реально делать по шесть книг в день (как раз три фильма успеваю посмотреть). Вычитывают другие. Вычитывать все это мне самому - никакого времени не хватит. Да и средний уровень всех этих книг...


Сканер, что сейчас в работе ~300 стр. в час (формат стандартный, 125*200)
Предыдущий давал  200 стр. в час, рекорд ~2000 стр. за день. Сейчас не смогу так.

По правке(ФР) рекорд - 1100 стр. за день.

Если делать книги современного издания, то качество обеспечит еще бОльшую скорость правки.
Наверх
 
 
IP записан
 
Ustas
Постоялец
**
Вне Форума


даешь качественный OCR!

Сообщений: 176
Пол: male
Re: Сайт на букву F или шаг вперед и три назад
Ответ #27 - 28.10.2005 :: 09:33:12
 
Проблема как раз в вычитке, а не в сканах.
обычный спеллчек не сделает книгу гарантированно чистой.
А на ридчек специфической литературы - у многих нет ни времени, ни желания.

ЗЫ Заведую скорости ваших сканеров Улыбка
У меня максимум - 150 стр в час
Наверх
 
WWW 67730822  
IP записан
 
amyatishkin
Активист
***
Вне Форума


Всем привет!

Сообщений: 426
Re: Сайт на букву F или шаг вперед и три назад
Ответ #28 - 28.10.2005 :: 12:53:05
 
Угу. Проблема в добровольцах на вычитку. А литература у меня специальная.

ЗЫ. 200 стр/час на P166 делал сканер LPT, купленный в 1998 г. Так что берегите свое время - вкладывайте в сканер и его настройку.
Наверх
 
 
IP записан
 
Antikwar
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 78
Москва
Пол: male
Re: Сайт на букву F или шаг вперед и три назад
Ответ #29 - 28.10.2005 :: 13:48:52
 
Не знаю... Купил себе простенький HP с безобразным софтом. Ну, 300 страниц/час он стопудово делает. А может и больше. Главное листать успевать. Улыбка
Наверх
 
 
IP записан
 
Страниц: 1 2 
Послать Тему Печать