AbsurdMan писал(а) 30.06.2020 :: 22:45:17:не успел уведомить, что книга готова...
Нет тут ни вашей, ни моей вины.
Проблема дублирования контента реально существует, и пока что вменяемого решения этой проблемы я не вижу.
В глобальном плане, если взять весь массив книг как домен определенной размерности, то в начальной стадии его оцифровки, любое количество оцифрованных единиц-книг составляющих этот домен, при оцифровке различными, не связанными между собой оцифровщиками, имеют исчезающе малый шанс пересечься.
Но с увеличением количества оцифровщиков и оцифрованных книг, количество совпадений будет расти по экспоненте. Это если не использовать какие то способы согласования действий оцифровщиков, или не использовать поиск по глобальному массиву домена.
Но проблема, состоит в том, что действия приверженцев авторского права, привели к тому, что на многие библиотеки затрудняют или вообще блокируют доступ. Кроме того искажают результаты поисковиков таким образом, что поиск требуемого ответа о наличии или отсутствии книги в ряду оцифрованных становится недостоверным. Если поисковик книгу находит, то скорее всего на платных ресурсах, если же не находит, то не факт, что ее нет на сайтах исключенных из выборки поискового алгоритма.
Круг замыкается на том, что достоверность поиска стремится к нулю. Любые проверки в данной системе недостоверны.
Данная система, без выхода за ее рамки решения не имеет.
Она может быть решена, в глобальном плане, только двумя способами:
- либо через создание глобального, неподконтрольного авторскому праву, каталога, где будут указываться все оцифрованные книги, и если книга в нем отсутствует, то она считается не оцифрованной;
- либо через создание неподконтрольного авторскому праву поисковика, с тем же примерно результатом, за исключением того, что здесь книга будет считаться не оцифрованной если не попадает в зону поиска.
Глобально мы вряд ли что сможем изменить, на нашем этапе самоорганизации, а вот определить для себя какой то локальный каталог или поиск можем.
В качестве локального каталога можно использовать какой либо сайт неподконтрольный авторскому праву, например AAW предлагал выкладывать все на либген, кроме библиотеки Ершова. Поиск на нем будет считаться легитимной версией оцифрована ли книга или нет.
Или, как я вам предлагал выбрать ограниченную группу сайтов, которую опоисковывать перед оцифровкой книги, на предмет сделали ее уже ранее или нет.
Второй путь сложней и затруднительней, хотя и возможен.