Рассматривается задача восстановления отсутствующих или утраченных связей между библиографическими записями. На практике часто встречаются расхождения в заполнении одноименных полей данных, на основе которых возможно вычислять связь между соответствующими записями. Причинами этого могут быть типографические ошибки, неполнота информации, различия в традициях и привычках каталогизаторов и т.п. В работе предлагается алгоритм автоматического сопоставления записей, позволяющий работать в условиях расхождений и неполноты информации. Приведен пример связывания библиографических записей с авторитетными записями имен авторов в формате RUSMARC. Описанный подход не ограничен рамками библиографических баз данных и может использоваться для сопоставления любых структурированных записей. Кроме того, разработанный алгоритм может применяться к задаче выявления дублирующихся записей.
Файл с полным текстом: | Knyazeva.pdf |
Файл презентации: | Knyazeva_prezent.pdf |