В работе рассматривается применение мультиэвристического подхода к проблеме определения схожести строк, кодирующих молекулы ДНК. Перед применением мультиэвристического подхода строки обрабатываются специальным алгоритмом архивации, описанным в данной работе. При сравнении получившихся строк учитываются также некоторые характеристики, полученные после архивации.
Мультиэвристический подход позволяет получить целый класс метрик на множестве строк, некоторые из которых могут дать интересные результаты при применении их к сравнению ДНК. Использование его совместно с алгоритмом архивации позволяет не только анализировать сжатые данные без их распаковки, но и даёт возможность учесть некоторые характеристики исходных строк, полученные в процессе архивации.
Файл тезисов: | Панин, Хайруллова — тезисы.doc |