Автоматическая реконструкция ассоциативных генных сетей на примере анализа протеома мочи

Tiys E.S.   Demenkov P.S.   Ivanisenko V.A.   Kolchanov N.A.

Автоматическая реконструкция ассоциативных генных сетей на примере анализа протеома мочи

Докладчик: Tiys E.S.

 

При автоматической реконструкции генной сети, описывающей биологические процессы существует проблема определения границ будущей сети в глобальной генной сети организма [1]. Такие подсети могут быть ограничены координированно функционирующими группами генов, выявляемыми анализом различных геномных и протеомных экспериментов [2].
Целью работы являлось изучение протеома мочи здоровых лиц, во время их жизнедеятельности в контролируемых условиях 105-суточной изоляции, при воздействии различных режимов солепотребления. Новым подходом к решению этой задачи служило использование протеомных технологий получения данных и современных биоинформационных технологий их анализа, включая реконструкцию ассоциативных генных сетей на основе автоматического извлечения знаний из текстов публикаций.
Среди более чем 20 тыс. выявленных пептидов обнаружено 690 протеотипических, по которым  идентифицировано около 600 белков, пополнивших базу данных мочевых белков здорового человека.
Для классификации белков по сходству динамики их появления и исчезновения в моче добровольцев был проведен иерархический кластерный анализ. Полученное иерархическое дерево было разбито на 92 кластера, включающих не больше 30 белков каждый.
Для анализа функциональных ассоциаций между белками в кластерах была использована компьютерная система ANDCell (Associative Networks Discovery in Cells), разработанная для реконструкции ассоциативных генных сетей, описывающих взаимосвязи между молекулярно-биологическими, биохимическими, клеточными, физиологическими и другими объектами и процессами на основе автоматического анализа текстов публикаций [3].
Анализ связи белков в разных кластерах с биологическими процессами Gene Ontology показал, что многие из полученных кластеров тесно связаны с отдельно взятыми биологическими процессами.
Для данных кластеров были реконструированы ассоциативные интерактомные сети, характеризующие белок-белковые взаимодействия.
Автоматическая реконструкция ассоциативных сетей требует дополнительной проверки их связи с изучаемым процессом. Одним из подходов решения этой задачи может быть сравнение реконструированных сетей со случайными сетями. Сравнение сетей для рассматриваемых кластеров со случайными сетями проводилось по следующим характеристикам: (1) частоты встречаемости участников анализируемых сетей в случайных сетях, (2) количество вершин в анализируемых и случайных сетях, (3) связность новых участников с исходными вершинами в анализируемых и случайных сетях.
Значимые отличия от случайных сетей были обнаружены для нескольких кластеров. Один из этих кластеров оказался наиболее тесно ассоциирован с натрием (более половины всех белков в интерактомной сети этого кластера имели связи с NaCl). Следует отметить, что с натрием были ассоциированы как белки, непосредственно идентифицированные в эксперименте (CD59_HUMAN, RNAS2_HUMAN, CD44_HUMAN, ALBU_HUMAN, OSTP_HUMAN), так и другие участники интерактомной сети (121 участник из 232 белков сети).
Проведённая кластеризация данных, позволила предположить существование групп координированно функционирующих белков. Построение ассоциативных генных сетей для каждого из кластеров и сравнение таких сетей со случайно выбираемыми из полной ассоциативной генной сети человека позволяют ранжировать кластеры  выявляемые методами протеомного анализа по степени связанности содержащихся в них белков.

Литература:
1. Ulitsky I., Karp R. M., Shamir R. Detecting disease-specific dysregulated pathways via analysis of clinical expression profiles // Conference: Research in Computational Molecular Biology — RECOMB , pp. 347-359, 2008.
2. Rapaport F., Zinovyev A., Dutreix M., Barillot E., Vert JP. Classification of microarray data using gene networks // BMC Bioinformatics. 2007 Feb 1;8:35.
3. Деменков П.С., Аман Е.Э., Иванисенко В.А. Associative Network Discovery (AND) – компьютерная система для автоматической реконструкции сетей ассоциативных знаний о молекулярно-генетических взаимодействиях. Вычислительные технологии. 2008, т.1, №1, С.47-50.