Высокопроизводительное секвенирование нового поколения (NGS) и анализ данных (СЕКВИНИРОВАНИЕ): Геномика и эволюционная биология

Данная секция посвящена актуальным проблемам системной биологии, связанным с современными технологиями высокопроизводительного секвенирования ДНК — секвенирования следующего поколения  (next generation sequencing, или NGS). Бурный рост объемов данных секвенирования следующего поколения требует разработки новых методов анализа, процессинга и препроцессинга прочтений ДНК с использованием математических и статистических методов. Широкий круг применений анализа данных секвенирования в исследовании регуляции экспрессии генов, медицинской геномике, биотехнологических приложениях требует согласования форматов, соблюдения общих стандартов представления информации, с использованием «сырых» данных секвенирования и разработкой общих конвейеров их компьютерной обработки и модельной интерпретации, в том числе существующих и получающих большее распространение платформ секвенирования Roche 454, Illumina, SOLiD, Ion Torrent. Будут рассмотрены вопросы развития высокопроизводительных методов секвенирования нового поколения, обеспечивающих исследователей значительными массивами ценнейших данных нового типа, таких, как глобальное профилирование модификаций хроматина, полногеномные профили ДНК-белковых взаимодействий (ChIP-seq), полное профилирование транскриптома, полногеномное картирование однонуклеотидных полиморфизмов (ОНП, или SNP). Полученный в последние годы объем экспериментальных данных геномики (RNA-seq, ChIP-seq, ChIP-exo, ChIA-PET, Hi-C) требует развития собственных программных средств анализа таких данных, в том числе с учетом развития технологий анализа транскриптомных данных на уровне одной клетки (single cell analysis). Фундаментальный анализ таких полногеномных данных предполагает рассмотрение проблем геномики с точки зрения фундаментальных процессов – нуклеосомной организации ДНК, трехмерной организации хромосом и хромосомных контактов в ядре клетки. Вопросы получения, эффективной обработки и интеграции данных являются ключевыми для решения задач регуломики, которым будут посвящены доклады на этой сессии. Практические занятия будут включать тестирование программ анализа данных экспрессии генов, фильтрации данных RNA-seq, обработки данных профилей ChIP-seq, анализа нуклеотидных контекстов прочтений ДНК.