Подробная программа Школы (.pdf)
Сетка расписания программы в табличном виде, версия от 16 мая (.pdf)
Структура расписания:
22 мая (ПН):
– регистрация, открытие, лекции (№ 1, 4, 6), практики (№ 2,6),
– экскурсии «Доместикация серой крысы» и в «Музей истории генетики в Сибири»,
– фуршет.
23 мая (ВТ):
– доклады молодых ученых,
– экскурсия по Академгородку.
24 мая (СР):
– лекции (№ 2,5,8), практики (№ 1, 4)
– экскурсии «Доместикация серой крысы» и по ЦКП ИЦиГ СО РАН
25 мая (ЧТ):
– практики (№ 2, 4, 7), лекция (№ 3),
– экскурсия по Новосибирску.
26 мая (ПТ):
– практики (№ 3, 5), лекции (№ 7, 9),
– экскурсии в Ботсада ЦСБС СО РАН и в «Музей истории генетики в Сибири».
Перечень лекций и практик
14-й Международной школы молодых ученых
«Системная Биология и Биоинформатика» /
14th International young scientists school «System Biology and Bioinformatics»,
SBB-2023
ЛЕКЦИИ:
- Компьютерная транскриптомика
Афонников Дмитрий Аркадьевич, в.н.с., доцент, к. б. н., ИЦиГ СО РАН, Новосибирск - Список дифференциально экспрессирующихся генов: что он скрывает?
Землянская Елена Васильевна, с.н.с., к.б.н., ИЦиГ СО РАН, Новосибирск - Математические модели геномной селекции
Самсонова Мария Георгиевна, д.б.н., СПбПУ, Санкт-Петербург - Моделирование молекулярно-генетических систем живых организмов
Лашин Сергей Александрович, в.н.с., к.б.н., ИЦиГ СО РАН, Новосибирск - Введение в потоковое моделирование метаболических систем микроорганизмов
Клименко Александра Игоревна, н.с., к.б.н., ИЦиГ СО РАН, Новосибирск - Математическое моделирование биологических систем
Криворотько Ольга Игоревна, с.н.с., к.ф.-м.н., ИВМиМГ СО РАН, Новосибирск - Филогения и эволюция
Щербаков Дмитрий Юрьевич, г.н.с., доцент, д.б.н., ЛИН СО РАН, Иркутск - На пути к искусственным нервным системам посредством обратной инженерии мозга и эволюции виртуальных организмов
Пальянов Андрей Юрьевич, д.ф.-м.н., директор ИСИ СО РАН, Новосибирск - Реконструкция генных сетей на основе методов автоматического анализа текстов научных публикаций, патентов и фактографических баз данных
Иванисенко Владимир Александрович, в.н.с., доцент, к.б.н., ИЦиГ СО РАН, Новосибирск
ПРАКТИКИ:
- Введение в потоковое моделирование метаболических систем микроорганизмов
Казанцев Федор Владимирович, н.с., к.б.н., ИЦиГ СО РАН, Новосибирск - Анализ транскриптомных данных
Пронозин Артем Юрьевич, м.н.с., ИЦиГ СО РАН, Новосибирск - Работа с пакетами программ геномной селекции
Козлов Константин Николаевич, в.н.с., доцент, к.б.н., СПбПУ, Санкт-Петербург - От мотивов связывания транскрипционных факторов к экспрессии генов. Что можно узнать из данных ChIP-seq эксперимента?
Долгих Владислав Андреевич, м.н.с., ИЦиГ СО РАН, Новосибирск - Реконструкция генных сетей с использованием программы ANDVisio платформы ANDSystem
Иванисенко Тимофей Владимирович, н.с., ИЦиГ СО РАН, Новосибирск - Построение и анализ SIR моделей распространения эпидемий
Криворотько Ольга Игоревна, с.н.с., к.ф.-м.н., ИВМиМГ СО РАН, Новосибирск - «Мультиомное профилирование единичных клеток на платформе BD Rhapsody
(scRNA-seq и Ab-Seq)»
Ольга Юрьевна и Роман Юрьевич Перик-Заводские, лаборанты-исследователи, НИИФКИ, Новосибирск
ОПИСАНИЯ ПРАКТИК
(будут выкладываться по мере поступления их от ведущих практики)
1. Введение в потоковое моделирование метаболических систем микроорганизмов
В рамках практики будет рассмотрена структура моделей метаболических путей бактерий. Построим собственную модель, узнаем где брать готовые, научимся запускать вычислительные эксперименты и визуализировать результаты моделирования на «карте метаболических путей». От слушателей требуется знание основ работы с языком программирования Python. На практике будет использоваться следующий инструментарий:
– Python (www.python.org) – язык программирования. Предпочтительная среда разработки – Jupiter (jupyter.org).
– CobraPy (cobrapy.readthedocs.io) – библиотека построение и анализа моделей метаболических путей.
– Escher (escher.readthedocs.io) – библиотека построение и визуализации карт метаболических путей.
2. Анализ транскриптомных данных
Практический курс посвящён изучению методов и программ биоинформатической обработки данных экспериментов по секвенированию транскриптома (RNA-seq). Основная цель курса – освоение методов de novo реконструкции транскриптома из данных RNA-seq и дальнейшего анализа полученных сборок транскриптома, в частности – поиска дифференциальной экспрессии транскриптов. В рамках данного курса участники познакомятся с программным обеспечением, используемым на разных стадиях обработки данных RNA-seq – фильтрации прочтений библиотек, de novo реконструкции транскриптома, оценке уровней экспрессии, выделения генов, имеющих достоверную дифференциальную экспрессию. Будет освоено следующее программное обеспечение: FastQC, FastP, Trinity, transrate, Kallisto, пакет DeSeq2 для языка программирования R.
План практических занятий (7 часов):
1. Знакомство с Linux. (1.5 часа). Базовые команды Linux. Правило работы на кластере. Запуск скриптов shell.
2. Контроль качества сырых прочтений. (1.5 часа). Форматы данных NGS. Загрузка данных из архива SRA. Формат FASTQ. Оценка качества чтения и фильтрация последовательностей по качеству. Программы оценки качества и удаления адаптеров (FASTQC, cutadapt, trimmomatic и др.)
3. Сборка транскриптома de novo. (1.5 часа). Работа с программой Trinity. Работа с результатами сборки. Оценка качества сборки transrate.
4. Квантификация. (1.5 часа). Работа с программой Kallisto. Анализ дифференциальной экспрессии генов с помощью программы DeSeq2 пакета R.
5. Аннотация полученного списка генов. (1 часа). Функциональная аннотация списков дифференциальной экспрессии генов. Онтология генов. Работа с базой данных KEGG.
3. Работа с пакетами программ геномной селекции
Предварительная подготовка
Необходимо иметь компьютер либо ноутбук, с установленными программами для работы в среде R, версии 4. Желательно иметь возможность устанавливать пакеты из исходных кодов непосредственно из github, работать в Jupyter Notebook, открывать текстовые файлы в кодировке UTF-8 в текстовом редакторе (не офисном пакете), открывать таблицы в формате CSV с разделителем запятая (‘,’ не только ‘;’).
Предварительные навыки
Умение запускать программу для работы в среде R, устанавливать дополнительные пакеты стандартными командами. Желательно уметь устанавливать дополнительные пакеты из исходных кодов. Знать базовый синтаксис языка скриптов R, основные типы данных: таблица, строка, число, фактор; основные конструкции: присваивание, условный переход, цикл.
Рекомендуемый набор программ
– R-4.1 и соответствующие пакеты для разработки (на Windows это Rtools).
– git (на Windows – Git Bash).
– Python 3.10 (На Windows от Anaconda) + Jupyter с ядром для R.
– Bioconductor.
– LibreOffice 7.
– Visual Studio Code.
Программа занятий
1. Установка пакетов для геномной селекции.
2. Проверка установки.
3. Загрузка данных. Обзор данных. Импутация. Матрица родства. PCA.
4. Модель RR-BLUP (пакет rrBLUP). Построение, опции, анализ, визуализация.
5. Байесовские модели (пакеты BGLR, BWGS).
4. От мотивов связывания транскрипционных факторов к экспрессии генов. Что можно узнать из данных ChIP-seq эксперимента?
В рамках практики будут рассмотрены подходы к поиску и аннотации сайтов связывания транскрипционных факторов в эукариотических геномах. Будут разобраны основные модели мотивов, описывающих сайты связывания. Участники практики научатся распознавать мотивы в данных ChIP-seq, определять их расположение в пиках, аннотировать их и определять их ассоциацию с экспрессией генов. От участников понадобится умение работать в командной строке OC Linux, а также базовые знания языка программирования R.
5. Реконструкция генных сетей с использованием программы ANDVisio платформы ANDSystem
Генные сети описывают сложные молекулярно-генетические, биохимические, физиологические процессы, контролирующие формирование фенотипических и клинических признаков человека. В качестве узлов в генных сетях выступают молекулярно-генетические объекты (белки, гены, микроРНК, лекарства и т.д.), а ребрами являются различные виды взаимодействий между ними (белок-белок взаимодействия, каталитические реакции, регуляторные связи и так далее). Гетерогенные или ассоциативные генные сети, представляют собой расширенный вариант генных сетей, в качестве вершин которых наряду с молекулярно-генетическими объектами могут быть представлены сущности более высокого уровня (биологические процессы, фенотипические признаки, заболевания, факторы внешней среды и др.), связанные между собой регуляторными, физическими, химическими или ассоциативными взаимосвязями. В ИЦиГ СО РАН разработана программно-информационная система ANDSystem (Demenkov et al., 2012; Ivanisenko et al., 2015, Ivanisenko et al., 2019, Ivanisenko et al., 2020), предназначенная для полного цикла инженерии медико-биологических знаний, включая автоматическое извлечение из текстов научных публикаций, патентов и фактографических баз данных с помощью синтактико-семантических правил и нейросетевых методов, формализацию знаний и их представление в базе знаний в виде ассоциативных генных сетей, пользовательский доступ к базе знаний, графическое представление и анализ результатов работы с базой знаний.
Практическое занятие будет посвящено использованию программы ANDVisio, являющейся модулем системы ANDSystem, для реконструкции и анализа ассоциативных генных сетей. Слушатели смогут ознакомиться с основными функциональными возможностями программы в процессе работы с конкретными примерами, включая различные сценарии реконструкции генных сетей, поиск регуляторных путей и методы анализа структурных характеристик графов. Работа с программой будет требовать ее загрузки на локальный компьютер и интернет-связи (операционные системы: Linux, Windows, Mac). Каких-то специальных требований к знаниям/навыкам нет.
6. Построение и анализ SIR моделей распространения эпидемий
На занятии мы на простейших примерах моделей SIR типа, описывающих распространение инфекционных заболеваний, численно проанализируем область применимости и свойства SIR моделей для разных инфекционных заболеваний (сезонных и длительных). Параметры моделей характеризуют эпидемию в выбранном регионе (скорость распространения вируса, выздоровления, процент бессимптомных/латентных инфицированных, смертность и другие). Будет проанализировано поведение параметров при разных типов данных, а также анализ чувствительности математических моделей, позволяющий отследить степень чувствительности измерений к вариациям параметров. На основе анализа чувствительности параметры моделей будут восстановлены методами
оптимизации и решения обратных задач, что позволит улучшить предсказание базовых моделей описания вспышки эпидемий. На занятии будут представлены примеры моделирования прямых и обратных задач на языке программирования Python, на основе которых студентам предоставится возможность построить свою модель описания инфекционного заболевания.
Необходимые навыки: знание синтаксиса языка программирования Python, основ
дифференциальных уравнений, методов вариационного исчисления и вычислительной математики.
7. Мультиомное профилирование единичных клеток на платформе BD Rhapsody
(scRNA-seq и Ab-Seq)»
По этой практике есть ограничения по участникам (5, максимум 6 человек). А также здесь есть минимальные требования: теоретические, лучше практические знания о: ПЦР, обратной транскрипции, гель-электрофорезу (лучше капиллярному), постановке bulkRNA-seq на платформе Illumina. Также полезны будут знания в области машинного обучения: снижение размерности t-SNE, UMAP, кластеризации K-means и иерархической кластеризации.