Lykas, а как подключить этот словарь? Просто я открыл тот словарь, который экспортирован из FineReader, а там такое вот начало:
Цитата:!!!DO NOT EDIT THIS FILE!!!
Portable Morphological Dictionary
Russian
30ХГСА[PTS=INV]
Абанин[PTS=NOU NMB=SG GDR=MSC CAS=NOM ANI=ANM]: Абанина[PTS=NOU NMB=SG GDR=MSC CAS=PTV ANI=ANM], Абанине[PTS=NOU NMB=SG GDR=MSC CAS=LOC ANI=ANM], Абанины[PTS=NOU NMB=PL GDR=MSC CAS=NOM ANI=ANM], Абаниных[PTS=NOU NMB=PL GDR=MSC CAS=GEN ANI=ANM]
И дальше идут строки со словоформами. Поискал в интернете, но видимо "Portable Morphological Dictionary" это какой-то внутренний формат для продуктов Abbyy.
А как Вы предлагаете добавить словарь 30-томника? Есть ли там словоформы? Как скормить его FineReader-у? Если есть опыт использования, буду признателен советам как импортировать.
P.S. Предлагаю всем, кто уже давно пользуется FineReader-ом и добавляет новые слова в словарь отписаться в этой теме и по вохможности выложить свои словари, независимо от тематики. Если кто не умеет заэкспортировать словарь, пишите, напишу или дам ссылку на детальную инструкцию.
P.P.S. Можно конечно разодрать готовую энциклопедию в электронном виде на уникальные слова и добавить их все в файл строками вида:
Цитата:Areca[PTS=INV]
Arendt[PTS=INV]
Arennt[PTS=INV]
Arent[PTS=INV]
Arentsen[PTS=INV]
Arentz[PTS=INV]
Arentzen[PTS=INV]
ARENTZENS[PTS=INV]
Ares[PTS=INV]
aretinske[PTS=INV]
По сути как неизменяемые слова. Но не сделает ли это хуже? Ведь словоформ нет, а я не уверен, что FineReader при распознавании не учитывает морфологию. Да и ошибки в энциклопедиях тоже встречаются. А если FineReader будет знать слова с ошибками, то он скушает их как нормально распознанные и даже не покажет при проверке. Хотя это может быть даже плюсом. Ошибки остаются, но это ошибки наборщиков и редакторов книг, а не собственно распознавания.