OCR форумы Добро пожаловать, Гость. Пожалуйста, выберите Вход или Регистрация
Всем привет!
Hi all!
 
  ГлавнаяСправкаПоискВходРегистрация Администратор Библиотека  
 
Страниц: 1 ... 17 18 19 20 21 ... 39
Послать Тему Печать
Сырые сканы книг (для обработчиков) (Прочитано 613387 раз)
Владислав_72
Активист
***
Вне Форума



Сообщений: 346
Москва
Пол: male
Re: Сырые сканы (для обработчиков)
Ответ #540 - 02.09.2018 :: 12:43:10
 
Цитата:
Абсолютно согласен.

А я вот абсолютно не согласен, и что?
Барьеры-то да, дело для новичков нужное и полезное, но вот кто имеет такое безапелляционное право эти барьеры выставлять - вот это совсем не очевидно, с моей точки зрения. Исключительно применительно к формату дежавю - возможно, но только к данному формату и только, а не в целом. "Не судите и не судимы будете", "Киньте в меня камень кто безгрешен".
Если бы выигрыш в объеме получаемого файла в этом формате не был бы десятикратно меньше по сравнению с другими форматами хранения сканов, а, скажем, раза в два всего (для ч/б книг имею в виду), здесь бы сейчас не было бы ни одного обработчика в таком формате. На этом все и держится пока. Овчинка выделки не стоила бы (в смысле временных затрат).
Наверх
 
 
IP записан
 
Dmitry7
Модератор
*****
Вне Форума


Соберем Серии "НВЖНиТ"!

Сообщений: 5950
Санкт-Петербург
Пол: male
Re: Сырые сканы (для обработчиков)
Ответ #541 - 02.09.2018 :: 14:08:58
 
Владислав_72 писал(а) 02.09.2018 :: 12:43:10:
Исключительно применительно к формату дежавю - возможно, но только к данному формату и только, а не в целом.

Я имел в виду не тонкости кодирования в дежавю, а качество первичной обработки сканов. Если в итоге первичной обработки будет убран мусор, искажения и прочее, а картинки не потеряют в качестве, не появится множество артефактов, то такие сканы все равно во что кодировать, в djvu или pdf, это уже вторично, по моему мнению
Наверх
 

"Если хочешь сделать что-то хорошо, сделай это сам!"
332371574  
IP записан
 
Lykas
Патриарх
*****
Вне Форума


Всем привет!

Сообщений: 1140
Re: Сырые сканы (для обработчиков)
Ответ #542 - 02.09.2018 :: 22:31:54
 
Геолог писал(а) 30.08.2018 :: 11:12:40:
Как для кого. Для неопределенного круга заинтересованных лиц. Может для нескольких, может для одного, может ни кому не понадобится. Мне книги нравились, когда их читал.

Да, выложил хорошие книги, без оценки качества сканирования или обработки.
Чужие книги не оцениваю, отношусь к ним как к подарку судьбы. Кто-то потратил время, возможно для себя, выложил для всех бесплатно. На том и спасибо.
Сам так начинал. Книги сканированные для себя и жены заняли в виде сканов пол диска, надо было их структурировать и сжать.

Было время, на один CD влазило десятка два книжек в сканах. Правда, винт тогда был сороковка. Улыбка
Цитата:
Есть и еще недостатки, меньшей значимости.
Ну и вот, последнее время, какая-то нездоровая тенденция размещать только идеальное. При этом без четких критериев этого идеального. Кто судить то будет? Если AAW, так здесь останутся два десятка обработчиков и без перспектив появится новым.

Да вы оптимист, батенька...
Попробуйте оценить число лиц, занимающихся постоянно сканированием на этом сайте и в целом Рунете. Хотя бы порядок.
ИМХО от 10 до 100.
Наверх
 
 
IP записан
 
Владислав_72
Активист
***
Вне Форума



Сообщений: 346
Москва
Пол: male
Re: Сырые сканы (для обработчиков)
Ответ #543 - 04.09.2018 :: 16:11:25
 
Цитата:
то такие сканы все равно во что кодировать, в djvu или pdf, это уже вторично, по моему мнению
Ну да, я это и имел в виду, упаковка - дело вторичное. Для пдф при наличии акробата там тоже все прозрачно в настройках, в чем жать монохром или полутона или цвет, чтобы не появились артефакты. Тем более в версии старше 11-й появилась и упаковка картинок в LZW (до этого была только в jpeg с разным уровнем качества и jpeg c вейвлет-упаковкой). Да и в других пакетах работы с пдф тоже с этими настройками проблем нет.
Цитата:
ИМХО от 10 до 100
Это на этом сайте. В рунете, думаю (ИМХО) до 1000, не больше.
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
На Форуме


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5609
Екатеринбург
Пол: male
Re: Сырые сканы (для обработчиков)
Ответ #544 - 04.09.2018 :: 17:22:00
 
Владислав_72 писал(а) 04.09.2018 :: 16:11:25:
В рунете, думаю (ИМХО) до 1000

это было бы не менее 100 книг ежедневно. Я такое только в период инфанаты припоминаю, и то свыше 60 новинок это уже был экстрарезультат. Я тут прикидывал, но меня попросили не публиковать ники людей: человек 40-50, может быть 80, не более.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
sad369
Гуру
****
Вне Форума


Всем привет!

Сообщений: 945
Re: Сырые сканы (для обработчиков)
Ответ #545 - 04.09.2018 :: 18:41:00
 
Цитата:
человек 40-50, может быть 80, не более.

Это на весь рунет???

Ники не нужны, но если взять последние поступления за последние 2-3 года, то здесь наверняка наберется 30-40 имен.  На рутрекере пожалуй чуть больше (без повторов). В целом я бы оценил количество людей 150-200. Это не считая тех, кто занимается форматами с распознаванием и вычиткой на либрусеке/флибусте. А их как минимум столько же.
Наверх
 
 
IP записан
 
zorro04
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 115
Re: Сырые сканы (для обработчиков)
Ответ #546 - 04.09.2018 :: 19:07:46
 
Да нет, и сотни человек не наберется (фб2-шников не считаю).
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
На Форуме


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5609
Екатеринбург
Пол: male
Re: Сырые сканы (для обработчиков)
Ответ #547 - 05.09.2018 :: 07:31:41
 
sad369 писал(а) 04.09.2018 :: 18:41:00:
за последние 2-3 года...наберется

зачем так. важна повторяемость. если хотя бы год и не одна книга, а раз в месяц.то есть человек не считает это случайностью для себя, а целенаправленно что-то делает.
на торрентах, по-моему, довольно много хороших обработчиков. мне штук пять разных имён попадалось, к чьим книгам особо не придерёшься. а я на торрентах вообще ничего специально не отслеживаю. причём книги были не чб.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
Dmitry7
Модератор
*****
Вне Форума


Соберем Серии "НВЖНиТ"!

Сообщений: 5950
Санкт-Петербург
Пол: male
Re: Сырые сканы (для обработчиков)
Ответ #548 - 06.09.2018 :: 20:26:28
 

вообще-то, по пальцам пересчитать (разовых сканировщиков, конечно, не считать, это случайные люди)
Наверх
 

"Если хочешь сделать что-то хорошо, сделай это сам!"
332371574  
IP записан
 
zorro04
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 115
Re: Сырые сканы (для обработчиков)
Ответ #549 - 26.09.2018 :: 13:08:27
 
Талмуд Э.Д. История Цейлона 1795-1965 гг. М., 1973
Я еще год назад сделал.
Наверх
 
 
IP записан
 
Dmitry7
Модератор
*****
Вне Форума


Соберем Серии "НВЖНиТ"!

Сообщений: 5950
Санкт-Петербург
Пол: male
Re: Сырые сканы (для обработчиков)
Ответ #550 - 26.09.2018 :: 22:24:07
 
AbsurdMan писал(а) 25.09.2018 :: 20:06:44:
Архимандрит Александр (Драбинко). Почему раскольнические группировки в Украине называются неканоническими (Историко-канонический анализ) [Изд. 3-е]. Киев, 2007


забирайте djvu (с OCR)
...

https://www.upload.ee/files/8993790/Drabinko.djvu.html
http://rgho.st/7KkGJP7H5

Наверх
 

"Если хочешь сделать что-то хорошо, сделай это сам!"
332371574  
IP записан
 
AbsurdMan
Патриарх
*****
Вне Форума


Всем привет!

Сообщений: 1256
Москва
Пол: male
Re: Сырые сканы (для обработчиков)
Ответ #551 - 27.09.2018 :: 17:17:34
 
zorro04 писал(а) 26.09.2018 :: 13:08:27:
Талмуд Э.Д. История Цейлона 1795-1965 гг. М., 1973
Я еще год назад сделал.

Я пропустил это... Не могли бы дать ссылку?

Dmitry7
Огромное спасибо!!!
Наверх
 
446581004  
IP записан
 
zorro04
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 115
Re: Сырые сканы (для обработчиков)
Ответ #552 - 27.09.2018 :: 17:55:42
 
Наверх
 
 
IP записан
 
zorro04
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 115
Re: Сырые сканы (для обработчиков)
Ответ #553 - 28.09.2018 :: 18:28:09
 
AbsurdMan писал(а) 28.09.2018 :: 00:38:33:
Машкин Н.А. История древнего Рима. М., 1950 (все карты на месте)
https://yadi.sk/d/4qxnP8oI3ZywkR


Возьму Машкина
Наверх
 
 
IP записан
 
AbsurdMan
Патриарх
*****
Вне Форума


Всем привет!

Сообщений: 1256
Москва
Пол: male
Re: Сырые сканы (для обработчиков)
Ответ #554 - 28.09.2018 :: 19:17:06
 
Симфония разума. Афоризмы и изречения отечественных и зарубежных авторов. Композиция Вл. Воронцова. М., 1977
https://cloud.mail.ru/public/88kP/agXHSLteU

Народная энциклопедия. Полутом исторический. 1911 года издания
https://cloud.mail.ru/public/9K9m/A43i9ZALn

Ульфкотте. Продажные журналисты
https://cloud.mail.ru/public/Moi3/P7TjVZGbG

Диксон. Фабрики мысли
Сделана.

Власов. Политические манипуляции
https://cloud.mail.ru/public/F8yw/1wUJPV4qQ

Красная книга ВЧК в 2 т.
Сделана, скоро выложу на рутрекере..

Че Гевара (сборник его трудов)
Сделана.

Холличер В. Природа в научной картине мира 1966
https://cloud.mail.ru/public/BiSC/wze3JX9jW

Холличер В. Человек в научной картине мира 1971
https://cloud.mail.ru/public/HF4d/YF3S2FCr1

Сталин и церковь
https://cloud.mail.ru/public/6Z54/DPDpva8A6

Юлина Н.С. Буржуазные идеологические течения США. Проблемы и противоречия «американского сознания»
https://cloud.mail.ru/public/CP6P/Nhd3CCqhs
Наверх
« Последняя редакция: 12.04.2019 :: 00:10:56 от AbsurdMan »  
446581004  
IP записан
 
zorro04
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 115
Re: Сырые сканы (для обработчиков)
Ответ #555 - 28.09.2018 :: 20:00:35
 
Опять 25, переложите, пожалуйста, кто-нибудь Машкина на мэйл ру. С яндекса опять битый архив скачивается.
Наверх
 
 
IP записан
 
celldark
Новичок
*
Вне Форума


Всем привет!

Сообщений: 1
Re: Сырые сканы (для обработчиков)
Ответ #556 - 30.09.2018 :: 19:00:37
 
zorro04 отписался, что ему уже удалось скачать Машкина.
Наверх
 
 
IP записан
 
zorro04
Постоялец
**
Вне Форума


Всем привет!

Сообщений: 115
Re: Сырые сканы (для обработчиков)
Ответ #557 - 23.10.2018 :: 20:55:52
 
Тэйлор Э. Первобытная культура. М., 1939
Беру, там , вроде, издание без купюр (в отличие от изданий 80-х-2000-х).
Наверх
 
 
IP записан
 
mcach
Новичок
*
Вне Форума


Всем привет!

Сообщений: 9
Re: Сырые сканы (для обработчиков)
Ответ #558 - 24.10.2018 :: 21:22:40
 
AbsurdMan писал(а) 28.09.2018 :: 19:17:06:
Че Гевара (сборник его трудов)

В сети есть макет, который выкладывало само издательство:
https://cloud.mail.ru/public/3GWa/jWa5dHUo1
Наверх
 
 
IP записан
 
mcach
Новичок
*
Вне Форума


Всем привет!

Сообщений: 9
Re: Сырые сканы (для обработчиков)
Ответ #559 - 25.10.2018 :: 17:12:15
 
AbsurdMan писал(а) 25.10.2018 :: 16:58:06:
Тюкавкин В.Г., Шагин Э.М. Крестьянство России в период трех революций. М., 1987

Чем это не устраивает?
Наверх
 
 
IP записан
 
Федор Меховой
Новичок
*
Вне Форума


Всем привет!

Сообщений: 29
Re: Сырые сканы (для обработчиков)
Ответ #560 - 30.10.2018 :: 02:54:49
 
AbsurdMan:
История Киева т1 страница "1 - 0084.tif" не читается с ЯД
(остальные читаются)
Наверх
 
 
IP записан
 
AbsurdMan
Патриарх
*****
Вне Форума


Всем привет!

Сообщений: 1256
Москва
Пол: male
Re: Сырые сканы (для обработчиков)
Ответ #561 - 30.10.2018 :: 17:52:36
 
Федор Меховой
Страницу заново пересканировал и залил туда же и под тем же наименованием.
Наверх
 
446581004  
IP записан
 
Федор Меховой
Новичок
*
Вне Форума


Всем привет!

Сообщений: 29
Re: Сырые сканы (для обработчиков)
Ответ #562 - 31.10.2018 :: 17:31:35
 
Спасибо, AbsurdMan.
Сейчас все читается.
Наверх
 
 
IP записан
 
Федор Меховой
Новичок
*
Вне Форума


Всем привет!

Сообщений: 29
Re: Сырые сканы (для обработчиков)
Ответ #563 - 01.11.2018 :: 06:00:02
 
AbsurdMan:
Рыбаков Б.А. Геродотова Скифия.
многочисленные проблемы:
- страницы с 1 по 113 похоже отсутствуют все (кроме цветных)
- на многих сканах нет номера страницы (например "1 - 0103.tif" или "цвет - 0004.tif"), а номера в именах файлов к номерам страниц не имеют никакого оношения
- есть повернутые на 90 градусов сканы, ориентацию которых в оригинале невозможно угадать (напр. "цвет - 0016.tif" или "цвет - 0031.tif")
- загадочный скан "хехе.tif" - что там и зачем он сделан?
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
На Форуме


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5609
Екатеринбург
Пол: male
Re: Сырые сканы (для обработчиков)
Ответ #564 - 01.11.2018 :: 06:56:55
 
Федор Меховой писал(а) 01.11.2018 :: 06:00:02:
загадочный скан "хехе.tif"

Это, наверное, была проверка, кто качает Улыбка
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
Федор Меховой
Новичок
*
Вне Форума


Всем привет!

Сообщений: 29
Re: Сырые сканы (для обработчиков)
Ответ #565 - 01.11.2018 :: 07:55:23
 
AAW писал(а) 01.11.2018 :: 06:56:55:
Это, наверное, была проверка, кто качает Улыбка

скорее, не кто  качает,  а кто читает отсканенное Подмигивание
Наверх
 
 
IP записан
 
AAW
Патриарх
*****
На Форуме


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5609
Екатеринбург
Пол: male
Re: Сырые сканы (для обработчиков)
Ответ #566 - 01.11.2018 :: 08:09:51
 
Федор Меховой писал(а) 01.11.2018 :: 06:00:02:
многочисленные проблемы

я дёргал пару-тройку архивов, на книжки посмотреть. Советую не использовать в именах файлов пробелы и русские буквы. Только ascii из первой половины таблицы. Вместо "цвет" - "color" или "c" или "c_", вместо "1 - " - "1_". И для людей, и для программ лучше будет.
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
AAW
Патриарх
*****
На Форуме


Старую детскую и НП литературу
ничем не заменить

Сообщений: 5609
Екатеринбург
Пол: male
Re: Сырые сканы (для обработчиков)
Ответ #567 - 01.11.2018 :: 13:52:35
 
AbsurdMan писал(а) 01.11.2018 :: 12:19:38:
Книгу Рыбакова, я думаю, стоит пересканировать

А что, значит, в ваших выкладках могут быть пропуски? Никто за этим не следит?!
Наверх
 

Если не я за себя - то кто за меня? Но если я только за себя - то зачем я нужен? И если не сейчас - то когда? (с) Гиллель, предположительно
155803224  
IP записан
 
AbsurdMan
Патриарх
*****
Вне Форума


Всем привет!

Сообщений: 1256
Москва
Пол: male
Re: Сырые сканы (для обработчиков)
Ответ #568 - 01.11.2018 :: 14:35:55
 
AAW писал(а) 01.11.2018 :: 13:52:35:
А что, значит, в ваших выкладках могут быть пропуски? Никто за этим не следит?!

Я насчёт пропусков пока сказать не могу, надо проверить. Сканы залиты давно и вроде как не редактировались, уже будучи на файлообменнике. скачаю и скажу позже.
Я имел ввиду качество, лучше сделать в 600.
Наверх
 
446581004  
IP записан
 
Федор Меховой
Новичок
*
Вне Форума


Всем привет!

Сообщений: 29
Re: Сырые сканы (для обработчиков)
Ответ #569 - 01.11.2018 :: 21:20:47
 
ну и еще по рыбакову:
- "1 - 0203.tif" - greyscale, но это карта во всю страницу; судя по другим однотипным страницам, она должна быть цветной
- безумная нумерация в именах файлов, напр:
  стр. 212 это файл "1 - 0193.tif"
  стр. 213 это файл "цвет - 0030.tif"
  стр. 214 это файл "1 - 0194.tif"
  Нельзя ли как-то упорядочивать файлы по порядку страниц, или хотя бы прикладывать текстовый файлик с соответствием бумажных страниц и имен файлов?
А то какой-то паззл получается, "собери картинку из перемешанных фрагментов" Улыбка
Обидно ведь, что ваш огромный труд по сканированию фактически уходит в никуда...
Наверх
« Последняя редакция: 01.11.2018 :: 21:33:19 от Федор Меховой »  
 
IP записан
 
Страниц: 1 ... 17 18 19 20 21 ... 39
Послать Тему Печать