OCR форумы Добро пожаловать, Гость. Пожалуйста, выберите Вход или Регистрация
Всем привет!
Hi all!
 
  ГлавнаяСправкаПоискВходРегистрация Администратор Библиотека  
 
Страниц: 1 2 3 
Послать Тему Печать
Координация сканирования книг. (Прочитано 60546 раз)
semy
Новичок
*
Вне Форума


Всем привет!

Сообщений: 44
Пол: male
Координация сканирования книг.
05.12.2010 :: 19:40:11
 
Ларин открыл сервис координации для сканировщиков на Либрусеке.
Пока подключились сканировщики Либрусека/Флибусты, Библиотеки Старого Чародея, Huge library.
http://lib.rus.ec/ocr
Обсуждение http://lib.rus.ec/node/258801 и http://lib.rus.ec/node/258767
Наверх
« Последняя редакция: 24.06.2011 :: 19:21:42 от Dmitry7 »  

Смог - молодец!
 
IP записан
 
AAW
Патриарх
*****
На Форуме


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5572
Екатеринбург
Пол: male
Re: Координация сканирования книг.
Ответ #1 - 05.12.2010 :: 20:22:34
 
любая "централизация" - это "шум по сети", в данном случае еще и заранее. А нам шум, по-моему, не нужен.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
Вадим
Администратор
*****
Вне Форума


Всем привет!

Сообщений: 1078
Россия
Пол: male
Re: Координация сканирования книг.
Ответ #2 - 05.12.2010 :: 21:32:57
 
Сколько не обменивались информацией о сканах, а пересечения все равно есть.
Есть и на этом форуме "Планы по сканированию", а толку?
Наверх
 
WWW  
IP записан
 
Lykas
Патриарх
*****
Вне Форума


Всем привет!

Сообщений: 1129
Re: Координация сканирования книг.
Ответ #3 - 05.12.2010 :: 23:54:37
 
Согласен, отсканировать книгу недолго, хуже с обработкой.
По сканам - с AAW было с десяток пересечений.
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
На Форуме


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5572
Екатеринбург
Пол: male
Re: Координация сканирования книг.
Ответ #4 - 06.12.2010 :: 10:28:20
 
ну а если сканишь "для себя" ?.. имеет ли смысл выдавать такую информацию?
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
semy
Новичок
*
Вне Форума


Всем привет!

Сообщений: 44
Пол: male
Re: Координация сканирования книг.
Ответ #5 - 07.12.2010 :: 09:54:09
 
Колхоз, как известно, дело добровольное.
Проект должен помочь сканировщикам: во-первых, предотвратить дублирование (по возможности), во-вторых, найти вычитывальщиков и верстальщиков (что уже делается на БСЧ).
Интересен для тех, кто занят худлитом.
Наверх
 

Смог - молодец!
 
IP записан
 
lavres
Новичок
*
Вне Форума


Всем привет!

Сообщений: 5
Re: Координация сканирования книг.
Ответ #6 - 06.01.2011 :: 16:10:13
 
"во-первых, предотвратить дублирование (по возможности), во-вторых, найти вычитывальщиков и верстальщиков"

Вот! Насканировано уже почти всё, что возможно, из старого (про новое пока не буду). Но даже из лучших, почти уже полностью платных электронбиблиотек берёшь и натыкаешься на застарелые ошибки, на неизвестно кем установленный весьма, на мой глаз, странный стандарт оформления. Переводчики не указаны сплошь и рядом, год выпуска книги - а это уже и книги разные. Иллюстрации теряются.
И хотят, чтоб кто-то за такое ещё и платил?
Дублей, конечно, быть не должно. Но не стоит запросто отметать всё одноимённое. Лучшее надо б отбирать.
Кто будет делать? Искать надо.
Я, вот, не при делах остаюсь, хоть ничего и не прошу, только возьмите всё, что смогу сделать.
Наверх
 
 
IP записан
 
Alex55
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 138
Москва
Пол: male
Re: Координация сканирования книг.
Ответ #7 - 15.03.2011 :: 09:25:17
 
Хорошо бы иметь общий каталог УЖЕ СДЕЛАННОГО в виде электронной таблицы или текстового файла, пригодного для импорта в excel.
Я не очень верю появляющимся здесь сообщениям, что всё уже сделано. Даже в плане сканирования.
Кстати, можно бы иметь и каталог искомого.
Наверх
 
WWW  
IP записан
 
Melory
Новичок
*
Вне Форума


Всем привет!

Сообщений: 16
Re: Координация сканирования книг.
Ответ #8 - 12.04.2011 :: 13:30:32
 
Есть замечательный сайт www.discogs.com. По-моему, нечто подобное надо сделать и с книжной базой.
Наверх
 
 
IP записан
 
zaaley
Активист
***
Вне Форума



Сообщений: 218
Пол: male
Re: Координация сканирования книг.
Ответ #9 - 12.04.2011 :: 17:22:37
 
Melory писал(а) 12.04.2011 :: 13:30:32:
Есть замечательный сайт www.discogs.com. По-моему, нечто подобное надо сделать и с книжной базой.


огромное время проведенное на этом сайте меня тоже натолкнуло на мысль сделать книжную базу.
Наверх
 
 
IP записан
 
ramirez
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 71
Пол: male
Re: Координация сканирования книг.
Ответ #10 - 13.04.2011 :: 13:26:35
 
Melory писал(а) 12.04.2011 :: 13:30:32:
По-моему, нечто подобное надо сделать и с книжной базой.


Просто база всех вышедших книг или база книг обработанных в электронный вид?
Наверх
 
 
IP записан
 
Melory
Новичок
*
Вне Форума


Всем привет!

Сообщений: 16
Re: Координация сканирования книг.
Ответ #11 - 13.04.2011 :: 17:12:50
 
Всех вышедших книг. Если есть электронная версия, на неё может быть ссылка. Если автор (писатель) не против. Если против, ссылку не давать. Просто сделать отметку, что есть электронная копия. Также может быть учтён аудиовариант. Также должна быть возможность продать или купить книжку. Для этого, предположительно, можно использовать alib.ru. Разумеется, ссылки надо будет время от времени обновлять или делать ссылку на библиотеку, что гораздо лучше, чем файлообменник. Вообще на дискогсе очень хорошая форма для заполнения. Она практически идеально подходит и для книжной базы. Надо только сменить названия некоторых полей. Может, несколько сумбурно, но пока как-то так. Было бы только, кому этим заниматься на постоянной основе.
Наверх
 
 
IP записан
 
dns
Гуру
****
Вне Форума


Всем привет!

Сообщений: 942
Красноярск
Пол: male
Re: Координация сканирования книг.
Ответ #12 - 13.04.2011 :: 18:00:25
 
Каталог всех книг, изданных на нашей маленькой планете? Тот, кто совершит сей подвиг, войдет в историю наравне с Гутенбергом Очень довольный

Неподъемная задача, не стоит откусывать заведомо больше, чем можно прожевать (ИМХО, само собой).
Наверх
 
 
IP записан
 
Melory
Новичок
*
Вне Форума


Всем привет!

Сообщений: 16
Re: Координация сканирования книг.
Ответ #13 - 13.04.2011 :: 18:03:56
 
Есть у революции начало, нет у революции конца. Discogs тоже бесконечен, но никто не жалуется.
Наверх
 
 
IP записан
 
dns
Гуру
****
Вне Форума


Всем привет!

Сообщений: 942
Красноярск
Пол: male
Re: Координация сканирования книг.
Ответ #14 - 13.04.2011 :: 18:14:51
 
Melory писал(а) 13.04.2011 :: 18:03:56:
Есть у революции начало, нет у революции конца.

Я так и предполагал. Перманентная революция, Мао, Большой скачок Подмигивание Только вот ценность обрывочной библиографии близка к нулю...

Впрочем, коли сил и времени не жалко - вперед и с песней, авось что-нить и получится.
Наверх
 
 
IP записан
 
Melory
Новичок
*
Вне Форума


Всем привет!

Сообщений: 16
Re: Координация сканирования книг.
Ответ #15 - 13.04.2011 :: 18:35:54
 
Кто сказал, что обрывочной? Этот проект должен быть рассчитан не только на Россию. Задача - сделать максимально полную и постоянно пополняемую базу с возможностью ведения персональных каталогов, куплей-продажей книг и прочими примочками. По-моему, необходимость этого уже назрела и сильно.
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
На Форуме


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5572
Екатеринбург
Пол: male
Re: Координация сканирования книг.
Ответ #16 - 13.04.2011 :: 20:42:15
 
Улыбка а зачем? Как пишут умные дяди, обычный человек способен прочесть за жизнь где-то около 1000 книг, ну пусть 3000 сильно упёртый. За жизнь! Это с одной стороны. А с другой - какой человеку интерес иметь в свободном доступе каталог РНБ? Пожалуйста, 7 000 000 книг доступны для обозрения, да и б-ка Конгресса тоже, это покрывает процентов 80, если не 90, всего изданного. Что дальше? А дальше следует два варианта: тематический поиск, и поиск конкретной книги в эл.виде. Обе задачи прекрасно решаются имеющимися ресурсами. Личный пример меня в этом убедил. Надо конкретную книгу - лезу в гугль, яндекс, либрусек, колхоз, ещё пару мест. Это шаг один, и поиск книги занимает не более 20 минут. Надо обозреть тему - ищу список литературы по теме (на спецсайтах, или в конкретной книге, да в БСЭ, в конце концов), и переход к шагу один для каждой строчки списка. Читаю и просвещаюсь. Зачем еще книжная база? Чтение одной позиции списка может занять и неделю. Что такое, по сравнению с этой неделей, экономия в 10-20 минут?.. тьфу!
Покупка-продажа тоже покрывается текущим предложением, всё строго по законам свободного рынка. Да, не сконцентрировано в одном месте. Но авось семантический веб нам всё решит просто и элегантно.

И замечу "на полях", что "библиография" - это далеко не перечень книг. Хорошая библиографическая подборка - это ещё и анализ, да с перекрёстными ссылками, не говоря уже о ранжировке по подразделам. Его, как говорят, довольно трудно сделать, и соответственно, мало кто делает. Потому что надо все книги списка прочесть. Тот, кто даёт "правильный" список, да в 600-700 строк - как у Грейвса, по мне так достоин медали, если не памятника. ИЗУЧИТЬ 600 источников... преклоняюсь.
Это была заметка на полях Улыбка ...Грамотнее уж составлять базу библиографических списков из бумажных оригиналов и спецсайтов. Вот этого - нет.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
Melory
Новичок
*
Вне Форума


Всем привет!

Сообщений: 16
Re: Координация сканирования книг.
Ответ #17 - 14.04.2011 :: 15:39:58
 
Ну, не знаю. Там всё как-то безлико и серо. Может, я плохо искал, но не нашел ни информации об авторе, ни, тем более, примеров оформления конкретного издания (обложка, иллюстрации), а ведь даже при переиздании они иногда отличаются, не говоря уже о зарубежных релизах. И потом, кто говорит о том, что это всё надо читать? Разумеется, это невозможно, да и не нужно. Это же не библиотека. Кстати, может, насчёт ВСЕХ книг я немножко поспешил, можно ограничиться и электронными, чтобы не сканировать по 10 раз одно и то же, но рано или поздно, вся бумажная литература попадет в сеть, так что... А то, о чём говорите Вы, наверное может быть реализовано с помощью перекрёстных ссылок.
Наверх
 
 
IP записан
 
Dmitry7
Модератор
*****
Вне Форума


Соберем Серии "НВЖНиТ"!

Сообщений: 5935
Санкт-Петербург
Пол: male
Re: Координация сканирования книг.
Ответ #18 - 14.04.2011 :: 19:46:20
 

Есть следующие каталогизаторы:

посмотрите, может что сгодится из этого?


1. All My Books       http://www.bolidesoft.com/rus/allmybooks.html

Основные возможности All My Books      

быстрая загрузка информации о книге из различных онлайн-библиотек, включая краткий сюжет, рецензии и картинку обложки      
    расширенная информация об авторах, переводчиках, редакторах, включая их фото      
    наглядное представление библиотеки с использованием различных шаблонов (используются редактируемые HTML-шаблоны)      
    большое количество стандарных полей в карточке книги (автор, название, ISBN, жанр, издательство, переплёт, число страниц, тираж, местонахождение, рейтинг и другие)      
    поддержка пользовательских полей - неограниченное количество текстовых и логических дополнительных полей      
    расширение функциональности и добавление новых онлайн-источников для импорта информации о книгах с помощью third-party plugins      
    статистическая информация о коллекции книг (статистика по жанрам, переплетам, авторам итд)      
    Пользовательский интерфейс поддерживает скины (темы, стили)      
    экспорт цифровой библиотеки во множество форматов - текстовый, PDF, HTML, CHM, XLS (Microsoft Excel), экспорт на мобильное устройство      
    импорт существующего списка книг из текстового формата или MS Excel      
    быстрый поиск нужных книг по заданному критерию. Поиск производится по всем стандартным и пользовательским полям      
    защита базы данных книг паролем      
    простой в использовании менеджер отданных книг - вы никогда не забудете когда и кому вы отдали книги      
    хранение неограниченного количества дополнительной графической информации для каждой из книг в базе данных      
    поддержка электронных книг - можно сохранить ссылку на файл в карточке книги и открывать книгу прямо из All My Books™. Кроме того, программа автоматически заполняет карточку книги для следующих форматов - FB2, FB2.ZIP, LRF, LIT, MOBI, PRC, PDB, EPUB, RB (RocketBook).      
    поддержка аудиокниг - запустить книгу на прослушивание можно прямо из программы. Автоматически считываются тэги и заполняется карточка книги для форматов MP3, WMA, OGG.      
    cетевой режим. Вы можете открывать файл базы книг одновременно с нескольких компьютеров.      
    печать коллекции с поддержкой редактируемых шаблонов отчетов



2. Программа "Учет книг"
http://www.simple-soft.ru/BooksCount.htm

Основные функции программы
Ведение базы книг, журналов. Каталогизация
В базе данных содержится информация о книгах, журналах. Предусмотрены такие поля как – название, авторы, категория, тип, издательство, серия, формат, год издания, количество страниц, тираж, обложка, ISBN, УДК, № шкафа, № полки, блок, подблок, время добавления и т.д.
Для каждой книги показываются все ее читатили (которые читали эту книгу ранее и читают сейчас).
Предусмотрены удобные способы сортировки и фильтрации данных, что позволяет быстро найти нужные книги.
Любую таблицу базы можно распечатать, экспортировать в MS Word, MS Excel или текстовый формат CSV. Имеется импорт из других источников данных в формате CSV.



3. Book Collector Pro
http://softsearch.ru/programs/86-849-book-collector-pro-collectors-download.shtm...

Book Collector Pro - Удобный органайзер для книг, журналов и др. Быстрая и мощная сортировка сделает предоставление материалов очень простым. От малых до больших коллекций, Book Collector Pro - все что нужно для сортировки. Функции рапорта и экспорта. С легкостью хранит более 100.000 позиций. Мгновенный доступ к нужному материалу. Разработан для международного использования
Наверх
 

"Если хочешь сделать что-то хорошо, сделай это сам!"
332371574  
IP записан
 
Dmitry7
Модератор
*****
Вне Форума


Соберем Серии "НВЖНиТ"!

Сообщений: 5935
Санкт-Петербург
Пол: male
Re: Координация сканирования книг.
Ответ #19 - 14.04.2011 :: 19:47:01
 
для домашней коллекции пользуюсь  "All My Books"
Наверх
 

"Если хочешь сделать что-то хорошо, сделай это сам!"
332371574  
IP записан
 
ramirez
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 71
Пол: male
Re: Координация сканирования книг.
Ответ #20 - 15.04.2011 :: 09:11:21
 
Melory писал(а) 14.04.2011 :: 15:39:58:
Кстати, может, насчёт ВСЕХ книг я немножко поспешил, можно ограничиться и электронными, чтобы не сканировать по 10 раз одно и то же

А что даст эта база "заэлектроненных" книг? Знание того, что когда-то эта книга была кем-то сделана? Но если ссылки на нее в сети битые и скачать книгу нигде не получается, то какой смысл в знании, что она когда-то была сделана, если книга фактически недоступна?

Если же на этом сайте, хранить и сами книги, то копирайтеры замучают. Но самое главное, размер диска для хранения такого количества книг будет ооооочень большим и со временем будет только увеличиваться в размерах, а исходящий и входящий трафик для сайта будет таким, что хостинг на таких условиях будет стоить просто нереальных денег.
Наверх
« Последняя редакция: 20.04.2011 :: 15:34:54 от ramirez »  
 
IP записан
 
ramirez
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 71
Пол: male
Re: Координация сканирования книг.
Ответ #21 - 15.04.2011 :: 09:54:36
 
Dmitry7 писал(а) 14.04.2011 :: 19:46:20:
Есть следующие каталогизаторы:


Есть еще Book Collector, я пользуюсь ей для катологизации книг и Movie Collector для катологизации фильмов. Очень удобно.

...

Для маков есть замечательная Delicious Library:

...

Наверх
« Последняя редакция: 15.04.2011 :: 10:17:52 от ramirez »  
 
IP записан
 
AAW
Патриарх
*****
На Форуме


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5572
Екатеринбург
Пол: male
Re: Координация сканирования книг.
Ответ #22 - 15.04.2011 :: 11:59:14
 
Melory писал(а) 14.04.2011 :: 15:39:58:
чтобы не сканировать по 10 раз одно и то же

Так всё же - в чём цель-то? В поиске уже отсканированного, или в каталоге бумажных книг, или в красивости представления информации? Или в чём ином? "Хочется чего-то" - сразу вспоминается Михаил Евграфович. Про севрюжину с хреном.
Поставьте чётко очерченную цель, тогда проблема сама собой решится. Ибо не вы первый, в 99,99% случаев, об этом подумали, и решения уже предложены. Я вот услышал "хочется, чтоб можно было на электронных полках покопаться, как на книжном развале. Обложки поперебирать, авось глянется чего." Нет?
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
Melory
Новичок
*
Вне Форума


Всем привет!

Сообщений: 16
Re: Координация сканирования книг.
Ответ #23 - 15.04.2011 :: 13:32:46
 
Цель такая: (взято с Discogs, но основные положения отражает верно) is a user-built database containing information on artists, labels, and their recordings. Discogs also incorporates a Marketplace where you can buy and sell the recordings. Discogs is constantly growing as users submit releases to the database. At Discogs you can search for information about music, track your collection and wantlist.  Вот так. Можно и без ссылок, чтобы не было проблем с правообладателями. Это только мое предложение, я ни на чём не настаиваю.
Наверх
 
 
IP записан
 
kerdnas
Новичок
*
Вне Форума


Всем привет!

Сообщений: 1
Re: Координация сканирования книг.
Ответ #24 - 23.08.2011 :: 13:41:07
 
Всем привет!
Я сосканировал кучу книг, готов их предоставить библиотеке. Но я принадлежу к братству слепцов, проверять муторно.
Что-то проверил, но под себя, так сказать, для зрячего там наверняка немного не так всё сделано.
Может я не в эту тему пишу, прошу прощения.
У меня есть пакеты файнридеровские, так что всё можно переделать.
Как, кому тут написать-переслать?
Наверх
 
 
IP записан
 
Ustas
Постоялец
**
Вне Форума


даешь качественный OCR!

Сообщений: 176
Пол: male
Re: Координация сканирования книг.
Ответ #25 - 23.08.2011 :: 22:37:13
 
список сканов - в студию Улыбка
Наверх
 
WWW 67730822  
IP записан
 
Dmitry7
Модератор
*****
Вне Форума


Соберем Серии "НВЖНиТ"!

Сообщений: 5935
Санкт-Петербург
Пол: male
сырые сканы для обработки
Ответ #26 - 23.08.2011 :: 22:28:40
 

Вот и я заодно кое-что выложил отсканированное:

может кто возьмется обработать? (шрифт местами плохо различим на серой бумаге)

"Словарь-минимум для чтения научной литературы на английском языке"
М.:Наука, 1969


сырые сканы (570 Мб в многотомном архиве):

http://narod.ru/disk/22702449001/slovar.part1.rar.html
http://narod.ru/disk/22704595001/slovar.part2.rar.html
http://narod.ru/disk/22706771001/slovar.part3.rar.html
http://narod.ru/disk/22709310001/slovar.part4.rar.html
http://narod.ru/disk/22710838001/slovar.part5.rar.html


желательно добавить OCR для возможности поиска.

Наверх
« Последняя редакция: 23.08.2011 :: 22:50:02 от Dmitry7 »  

"Если хочешь сделать что-то хорошо, сделай это сам!"
332371574  
IP записан
 
Dmitry7
Модератор
*****
Вне Форума


Соберем Серии "НВЖНиТ"!

Сообщений: 5935
Санкт-Петербург
Пол: male
Re: Координация сканирования книг.
Ответ #27 - 26.08.2011 :: 22:40:18
 
Наверх
 

"Если хочешь сделать что-то хорошо, сделай это сам!"
332371574  
IP записан
 
Dmitry7
Модератор
*****
Вне Форума


Соберем Серии "НВЖНиТ"!

Сообщений: 5935
Санкт-Петербург
Пол: male
Re: Координация сканирования книг.
Ответ #28 - 27.08.2011 :: 18:26:52
 

возьмите, пожалуйста, кто-нибудь в обработку книжку "Бок о бок с компьютером".
Наверх
 

"Если хочешь сделать что-то хорошо, сделай это сам!"
332371574  
IP записан
 
pohorsky
Патриарх
*****
Вне Форума


Подключайтесь к проекту
"Вся МРБ"!!!

Сообщений: 5916
Москва
Пол: male
Re: Координация сканирования книг.
Ответ #29 - 01.09.2011 :: 07:16:00
 
Dmitry7 писал(а) 27.08.2011 :: 18:26:52:
возьмите, пожалуйста, кто-нибудь в обработку книжку "Бок о бок с компьютером".


Скачал на скорости 8 КБ/с. за 4 суток. Приступаю к обработке.
Наверх
 
 
IP записан
 
Страниц: 1 2 3 
Послать Тему Печать