Летняя школа по молекулярной и теоретической биологии. Лекции по биоинформатике: анализ данных, нейросети, и их применение в биологии и медицине Программа школы поделена на два основных потока

С 1 по 18 августа 2017 года в в Калужской области в третий раз прошла Летняя биологическая школа «Пилигрим». Участниками стали школьники и преподаватели со всей России и из ближнего зарубежья (республики Беларусь и Казахстан).

Дети поучаствовали в практикумах по микробиологии, биохимии, физиологии растений, ботанике и зоологии, посещали лекции и семинары по вирусологии, молекулярной биологии, цитологии, генетике, химии, палеонтологии и множеству других естественнонаучных и околобиологических дисциплин, учились понимать англоязычные научные статьи и писать научно-популярные статьи на русском, слушали лекции приглашённых лекторов - ведущих учёных из известных научных организаций России и мира - от МГУ до Кембриджа.

Фонд «Эволюция» поддержал Школу трэвел-грантами - организаторы использовали их для частичной оплаты участия школьников из Великого Новгорода, Минска, Обнинска и других городов.

О том, как проходит школа, рассказывают участники, преподаватели и организаторы:

«Я узнала о БиоШколе благодаря Интернету и решила попробовать свои силы в отборе, - говорит Юля Сурганова из Алапаевска, получившая грант на бесплатное участие в 2017 году. Думала, что даже если я дальше не пройду, то всё равно попытаюсь решить эти задачки и интеллектуально отдохну на каникулах.
БиоШкола дала мне очень многое: я не только получила массу новых знаний, но и завела новых друзей по интересам. Обучение в школе дало мне утвердиться в том, что биология - это моё, и дало мощный стимул продолжать учиться дальше! Я хочу попробовать себя в олимпиадном движении, а что касается дальнейших перспектив, то поступить в медакадемию».

Вера Емельяненко, преподаватель, студентка 3 курса биофака МГУ, серебряный призёр Международной биологической олимпиады:

«Вообще, занятия в «Пилигриме» проходят очень интересно. Каждая пара длится полтора часа с одним пятиминутным перерывом; две пары после завтрака и одна - после обеда. По идее, между парами должен быть перерыв в полчаса. На деле же он почти всегда съедается до десяти-пятнадцати минут за счёт не вовремя заработавших проекторов, задержанного завтрака, недорезанных растений и недосказанных историй. Группы почти все маленькие, до девяти-десяти человек, и больше половины ребят выбирают тот курс, который они будут слушать, из нескольких альтернатив. Поэтому когда ты пытаешься что-то рассказать, тебя часто засыпают вопросами. Однажды после занятий, вечером, мои ДНК-2 попросили меня объяснить современную систематику эукариот и жизненные циклы водорослей ещё раз. Мы сели и начали это всё обсуждать, а через пятнадцать минут я с удивлением заметила, что почему-то рисую на доске принцип работы хоаноцита. И мне это очень нравится, потому что это значит, что человеку не просто хочется сдать зачёт, а действительно узнать что-то новое».

Приглашённый лектор Ильичева Дарья:

«11 августа наш старший инструктор Ильичева Дарья поехала в Калужскую область, где в этом году проходила летняя биошкола «Пилигрим». Что это за школа? Каждый год проводится отбор среди одаренных ребят по биологии, они проходят собеседование, чтобы приехать в биошколу. Ежедневно читаются лекции и проводятся практикумы по различным отраслям биологии, начиная от ботаники и вирусологии, заканчивая биохимией и биофизикой. Каждый выбирает себе занятия, которые ему наиболее интересны. Лекции читают лучшие педагоги популяризаторы из МГУ, МФТИ и других престижных ВУЗов. Дети получают новые знания, находятся в очень интересной научной среде, заводят новые знакомства. Вечером для них организуют просмотры фильмов, песни под гитару, чтение стихотворений, командные игры, что очень сплачивает учеников «Пилигрима».
Для нас стало честью принять участие в работе школы и прочесть лекцию «Генетика окрасов собак». Спасибо за бесценный опыт, теплую встречу и прекрасно проведенное время».

Мищенко Екатерина, соорганизатор школы, научный журналист:

«Мы очень хотим, чтобы доступ к знаниям был у каждого мотивированного ребёнка. Но оборудование, питание, проживание стоит денег, и хотя мы не делаем свой проект коммерческим (например, преподаватели не получают зарплату), деньги на участие и на дорогу есть далеко не в каждой семье. Именно поэтому для нас важны гранты - чтобы показать, что путь в науку для юных Ломоносовых должен быть открытым и доступным, чтобы дать им поверить в себя, понять, что для них интереснее и важнее - фундаментальная наука или фарма, биотехнологии для сельского хозяйства или систематика земноводных. Это может помочь ему не только выиграть в какой-то олимпиаде, но и сделать судьбоносный (по крайней мере, на первое время) выбор себя. Мы хотим сломать барьер преподавательского высокомерия, чтобы школьник не боялся к нам обратиться с самым «глупым» вопросом, но при этом не проиграть в качестве образования, поэтому большую часть преподавательской команды составляет молодёжь и студенты, хотя и настоящие учёные у нас тоже есть.
Это, конечно, отнимает много времени и сил, но потом просто замечательно наблюдать, как «поперечно-волосатые» мышцы наконец становятся поперечно-полосатыми, и как всё становится на свои места в головах многих детей».

Опубликовано 19.06.17 09:20

Ученые "обвинили" в холодном лете Китай. А у Гидрометцентра России свое объяснение.

15 июня стало самым холодным летним днем за 67 лет метеонаблюдений. Воздух в Москве погрелся всего до 10 градусов, а утром было 7-9 градусов.

Сейчас ученые нашли виновного в аномально холодном лете 2017-года. Им мог стать китайский спутник «Мо-Цзы», который участвовал в опытах по квантовому перемещению. Замеры показали, что в те дни, когда аппарат работал в полном режиме, резко портилась погода, шли дожди, усиливались ветры, передает НСН.

Впрочем, по их инткббэч словам, концентрация частиц в атмосфере вскоре нормализуется. Теперь специалисты намерены изучить влияние процессов, связанных с квантовой связью на погоду, так как до запуска инновационного спутника, проведенного китайскими учеными, подобные факторы не изучались.

В ближайшие 10 лет климат, скорее всего, будет волнообразным, с частыми сменами более высоких и более низких температур. Об этом "Российской газете" рассказал глава Гидрометцентра Роман Вильфанд.

По его словам, нормальных средних температур будет меньше, а вот чередование дождливых и засушливых периодов все больше. Также возможны и аномально теплые зимы, и заморозки летом. Что же касается ближайших летних перспектив для жителей Центральной России, то, по словам главы Гидрометцентра, июль все-таки обещает порадовать москвичей и жителей центральных регионов теплой погодой, которая будет на несколько градусов превышать норму. И даже полноценный купальный сезон удастся открыть. Правда, пока температура воды в московских и подмосковных водоемах не превышает 14 градусов.

Ближайшая неделя, как рассказала заведующая лабораторией Гидрометцентра Людмила Паршина, в столичном регионе ожидается умеренно теплой. Дневные температуры будут колебаться в пределах 22-24 градусов, ночные -10-12 градусов. Возможны дожди.

Что касается других российских регионов, то температурный фон везде разный - до 40-градусной жары, как в Новосибирской, Томской, Кемеровской областях и в Алтайском крае, до ночных заморозков, как в Мурманской области.

Лето в 2017 году не принесло никакой радости гражданам России. Весь июнь наблюдаются сильные дожди, ливни и даже ураганы. Аномально холодное лето 2017 портит все планы. Ведь в такую погоду сложно даже домой добраться, не то чтобы на пляж сходить. Почему же июнь выдался таким холодным? Прекратятся ли затяжные дожди? Чего ждать от июля и августа? Какая погода будет в следующие месяцы лета?

Причины аномального лета 2017

Метеорологи считают, что холодное лето наступило вследствие нескольких причин. Первая причина – аномальный нагрев Земли. Дело в том, что мезосфера и другие слои воздушной оболочки сильно нагреты. Из-за этого температура на Земле медленно снижается. Ученые предвещают последствия такой погоды – наступит не глобальное потепление, а глобальное похолодание, которое может привести к ледниковому периоду.

Вторая причина – запуск китайского спутника под названием «Мо-Цзы». Он является первым спутником, который предназначен для квантовой передачи информации на Земле. В ходе миссии исследуется механизм квантовой запутанности, а также проводится тестовая квантовая телепортация. Первые эксперименты прошли удачно, но потом что-то пошло не так.

Когда спутник начинает передавать информацию, в атмосфере увеличиваются отрицательные аэроионы, которые способствуют ухудшению погоды. На Земле образуются ураганы и ливни. Кроме того, в стратосфере появились монополя. В последний раз они были замечены в 1816 году, который был прозван годом без лета. Тогда основной причиной холодного лета стало извержение вулкана Тамбора.

Какой бы абсурдной эта причина ни была, мировые специалисты считают, что оборудование на спутнике и проводимые квантовые операции действительно могут повлиять на погодные условия планеты. Но они же сообщают, что в скором времени все должно нормализоваться, и наступит долгожданное лето.

Третья причина – «североатлантический блок». По словам метеорологов, «североатлантический блок» – это антициклон. На среднем уровне тропосферы сформировался мощный гребень высокого давления, который не пропускает воздушные массы с запада на восток. Сейчас этот блок находится в Великобритании, поэтому в Россию поступает только арктический воздух.

Каждая из этих причин может по-своему влиять на планету в целом, но пока что итог один – наблюдается аномально холодное лето. Остается лишь надеяться, что июль и август 2017 года принесут гражданам России немного больше тепла, чем июнь.

Прогнозы на июль и август 2017 года

По словам метеорологов, аномальной жары летом 2017 не будет. Но уже в июле шкала термометра начнет повышаться. Длительная прохлада сменится настоящим летом. Ожидается температура воздуха до +26 – 29 градусов. После праздника Ивана Купала температура поднимется еще на несколько градусов.

Согласно народному прогнозу, в июле россиян снова ждут дожди. И действительно, в середине месяца на несколько дней вернутся дожди. А вот конец месяца порадует отсутствием аномальной погоды. Будет тепло, температура поднимется до 32 градусов.

По народному прогнозу, погода в августе постоянно будет колебаться. Первая неделя месяца начнется с довольно жаркой погоды. Именно на этой неделе будет пик жары аномального лета 2017 в Москве. Жителям России рекомендуется посетить пляжи и немного позагорать. Метеорологи обращают внимание на то, что в это время возможны лесные пожары.

После недели жары вновь предстоит пережить несколько дождливых дней. С 25 градусов тепла температура опустится до 17 градусов. Во второй половине месяца следует ожидать еще немного тепла. Завершится август сильным ливнем и холодным ветром.

Лето 2017 года подарит не только проливные дожди, но и прекрасное летнее тепло. Жаркой погодой сможет насладиться каждый житель России. Не стоит расстраиваться раньше времени, даже аномально холодное лето однажды закончится.

Почти год назад, летом 2017 года, на базе МФТИ состоялась традиционная летняя школа от Института биоинформатики. Основной темой школы в этом году стал интеллектуальный анализ данных . Почему? Количество получаемых данных в биологии и медицине растет с невероятной скоростью. В то же время обнаружить ранее неизвестные вещи в таком объеме информации вручную физически невозможно (да и классическими алгоритмами уже тоже сложновато), поэтому приходится использовать статистику и дополнять естественный интеллект искусственным.

Именно этим активно и занимались участники летней школы. В этом посте собрано 22 видеозаписи лекций со слайдами и описанием для всех интересующихся темой анализа данных в биоинформатике. Лекции, которые можно смотреть без дополнительной подготовки, отмечены звёздочкой «*» (таких половина).


1*. Введение в биоинформатику (Александр Предеус, Институт биоинформатики)

В лекции рассмотрены основные области, в которых работают биоинформатики в науке и индустрии, особенности биоинформатики и причины ее популярности сегодня.

2*. Введение в машинное обучение (Григорий Сапунов, Intento)

Постоянный рост количества данных способствует развитию все более и более сложных процессов обработки, поиска и извлечения информации. Один из способов решения подобных задач заключается в использовании искусственного интеллекта. Эта лекция посвящена краткому введению в основы машинного обучения. Григорий рассказал общую терминологию в этой области, а также описал виды задач, решаемых машинным обучением. Помимо этого, лекция знакомит с основными этапами машинного обучения, видами моделей и метриками качества полученных данных.

3*. Введение в Deep Learning (Григорий Сапунов, Intento)

Глубокое обучение (или deep learning) в настоящее время набирает популярность из-за возможности не прописывать конкретные алгоритмы для решения задачи, а использовать обучение представлениям. Развитию этих методов также способствует увеличение вычислительной мощности процессоров. Лекция посвящена основам нейросетей: их видам (полносвязные нейросети, автоэнкодеры, свёрточные, рекуррентные) и решаемым ими задачам. Отдельно Григорий обрисовал современное состояние и тренды.

4*. Введение в онкогеномику и анализ омиксных данных в онкологии (Михаил Пятницкий, НИИ биомедицинской химии им. В.Н.Ореховича)

Секвенирование человеческого генома, изучение человеческих генетических вариаций, секвенирование метагенома человека, транскриптомный анализ человеческих тканей - все эти биологические методы в приложении к “Big Data” дали ученым большой объем ценной информации о том, что отличает человека от других животных. Эта лекция посвящена «омикам» и их практическому использованию. Отдельно Михаил затронул использование этих данных в онкологии.

5. Мультиомика в биологии: интеграция технологий (Константин Оконечников, German Cancer Research Center)

Бурное развитие экспериментальных технологий в молекулярной биологии, таких как например, секвенирование, позволили совместить в себе изучение большого спектра функциональных процессов происходящих в клетках, органах или даже целом организме. В лекции рассмотрено как правильно совмещать массивные экспериментальные данные, полученные из геномики, транксриптомики и эпигеномики для установления связей между компонентами происходящих биологических процессов. Наглядные примеры применения мультиомики выбраны из высоко востребованной области исследований раковых заболеваний с фокусом на педиатрическую онкологию.

6. Количественная генетика: история и перспективы (Юрий Аульченко, лаборатория теоретической и прикладной функциональной геномики ФЕН НГУ, группа методов генетического анализа, ИЦиГ СО РАН)

Количественная генетика - точная наука, которая основывается на небольшом числе ключевых наблюдений и базовых моделей, позволяющих дать количественное описание природных (микро)эволюционных явлений и предсказать результаты генетических экспериментов. Она использует мощный математический аппарат. Многие современные методы статистики были изначально разработаны для решения проблем количественной генетики. Прорывное развитие молекулярно-биологических технологий за последнее десятилетие позволило характеризовать сотни тысяч живых организмов по миллионам геномных и других «омиксных» параметров. Общее количество проведенных экспериментов и уже накопленных данных колоссально. Актуальная задача современной количественной генетики - разработка моделей, которые позволят описать наследования многоуровневых фенотипических высокой размерности. В своей лекции Юрий дал краткий обзор истории количественной генетики и проблем, которые стоят перед этой наукой.

7*. Технологии секвенирования (Кирилл Григорьев, Caribbean Genome Center, University of Puerto Rico)

Развитие и эволюция процессов секвенирования неразрывно связаны с эволюцией технологических возможностей. Лекция показывает историю и процесс развития технологий секвенирования от Сэнгера до наших дней. Отдельно Кирилл рассказал про преимущества и недостатки каждого из существующих в настоящее время методов, а также о характере получаемых данных и их применении в различных областях.

8. Транскриптомика: практические методы и применяемые алгоритмы (Александр Предеус, Институт биоинформатики)

Транскриптомика уверенно заняла место в списке самых популярных задач, встающих перед NGS-биоинформатиками. Дифференциальный анализ экспрессии генов, кластеризация экспрессионных данных, и интерпретация полученных данных в терминах метаболических и сигнальных каскадов позволяют получить богатейшую информацию о практически любой системе. В лекции рассмотрены лучшие пайплайны, основные проблемные места в дизайне экспериментов и обработке, а также практические случаи удачного применения транскриптомных подходов.

9. Анализ данных NGS в медицинской генетике: определение, аннотация и интерпретация генетических вариантов (Юрий Барбитов, СПбГУ, Александр Предеус, Институт биоинформатики)

Использование секвенирования нового поколения давно ушло за пределы классической науки и успешно применяется во многих других областях, в том числе в здравоохранении. Лекция посвящена ключевым аспектам анализа данных секвенирования нового поколения в медицинской генетике. Юрий показал весь путь от получения сырых ридов до постановки диагноза, с упоминанием трудностей, возникающих при определении, аннотации и интерпретации генетических вариантов. Отдельно он затронул распространенные ошибки, допускаемые на каждом из этапов обработки данных. В заключение дан краткий обзор перспективных направлений исследований, способных улучшить точность постановки диагноза с использованием методов высокопроизводительного секвенирования

10. Практическое применение ChIP-Seq и родственных методов (Александр Предеус, Институт биоинформатики)

Методы ChIP-Seq, а также «геномного футпринтинга» (ATAC-Seq, FAIRE-Seq, DNase-Seq) широко применяются для нахождения механизмов регуляции биологических процессов, в частности, для транскрипционной регуляции. Потенциальное пространство изучаемых факторов очень многомерно, однако селективный подход позволяет получить богатую информацию о регуляции в системе на основании всего нескольких экспериментов. На примере конфликтующих современных теорий, Александр показал основные сложности интерпретации регуляторной информации, и способы консолидации полученных результатов.

11*. Что можно делать с данными iScan (Татьяна Татаринова, University of La Verne)

Компания Illumina выпускает большое количество приборов под различные нужды. Чипирование позволяет быстро обнаруживать однонуклеотидные полиморфизмы (SNP) для большого количества образцов. Лекция посвящена обзору данных чипов iScan и их применению в клинической диагностике.

12. Глубокое обучение в вычислительной биологии (Дмитрий Фишман, University of Tartu)

Глубокое обучение активно используется не только для улучшения машинного перевода или распознавания речи, но и позволяет решить многие проблемы в области вычислительной биологии. Лекция посвящена применению методов глубокого обучения на конкретных биологических примерах. Дмитрий рассказал о том, что нового происходит в биологии и медицине с использованием глубокого обучения, и можно ли говорить о том, что машины революционизируют медицину и биологию.

13*. Применение методов машинного обучения для поиска потенциальных патогенных мутаций в геноме человека (Анна Ершова, МФТИ, НИИ физико-химической биологии МГУ им. М.В. Ломоносова, ФНИЦ эпидемиологии и микробиологии им. Н.Ф. Гамалеи)

Поиск патогенных мутаций стал актуальным в связи с секвенированием генома человека. Однако, вручную такую задачу решить просто невозможно. Лекция посвящена тому, как машинное обучение может помочь справиться с этой задачей.

14*. Иммуноинформатика (Вадим Назаров, НИУ ВШЭ, ИБХ РАН)

Машинное обучение уже довольно давно активно применяется в самых разных сферах жизни, но в иммунологии для него нашли место совсем недавно. В этой лекции Вадим рассказал о нескольких примерах применения машинного и глубинного обучения в иммунологии, включая задачу предсказания связывания МНС-пептид комплексов и анализа репертуаров Т-клеточных рецепторов.

15*. Изучение адаптации к хозяину и развития резистентности в вирусах ВИЧ и гепатита С с помощью методов структурной биоинформатики (Ольга Калинина, Институт информатики общества Макса Планка)

Вирус иммунодефицита человека (ВИЧ) и вирус гепатита С вызывают тяжелые заболевания, которые с трудом поддаются терапии. Как и многие другие ретро- и РНК-вирусы, эти вирусы быстро эволюционируют и, таким образом, могут приспосабливаться как к воздействию специфических антивирусных препаратов, так и к адаптивному иммунному ответу со стороны организма хозяина. В этой лекции Ольга показала, как с помощью комбинирования анализа последовательностей вирусных белков с анализом их пространственной структуры можно делать предсказания о развитии механизмов резистентности и взаимодействии вирусов с иммунной системой хозяина.

16. Предсказание эффекта мутаций (Василий Раменский, МФТИ)

Современные методы секвенирования дают огромный объем информации о полиморфизме генома, то есть отличиях индивидуальных геномов друг от друга. Эти отличия (варианты) возникают в результате мутаций при репликации ДНК и частично фиксируются в популяции. Распространенность, локализация и функциональный эффект геномных вариантов сильно различаются – от полной летальности до отсутствия какого-либо влияния на индивидуальный фенотип. В лекции рассмотрены современные подходы к предсказанию функционального эффекта вариантов, используемые в персонализированной медицине, медицинской и популяционной генетике.

17. Многомасштабное моделирование и дизайн биологических молекул (Николай Дохолян, University of North Carolina at Chapel Hill)

Жизнь биологических молекул охватывает масштабы времени и длины, соответствующие шкалам времени и длины от атомного до клеточного. Следовательно, новые подходы к молекулярному моделированию должны быть по своей сути многомасштабными. В своей лекции Николай описал несколько методологий, разработанных в его лаборатории: алгоритм быстрого дискретного молекулярного динамического моделирования, белковый дизайн и инструменты структурной доработки. Используя эти методологии, можно описать несколько приложений, которые проливают свет на молекулярную этиологию кистозного фиброза и находят новые фармацевтические стратегии для борьбы с этим заболеванием, моделируют структуру трехмерной РНК и разрабатывают новые подходы к контролю белков в живых клетках и организмах.

18. Гомологичный фолдинг белков (Павел Яковлев, BIOCAD)

В современной структурной биологии есть ряд вычислительных методов, позволяющих с высокой достоверностью характеризовать биологические молекулы, их схожесть и различия, способы взаимодействия и функции. Для построения подобных вычислений входным параметром всегда выступает пространственная структура белка, однако ее получение может быть затруднен, несмотря на полувековой прогресс в области кристаллографии. Лекция посвящена решению этой проблемы с помощью гомологичного моделирования структур белков - построения трехмерных структур из схожих фрагментов. Для примера рассмотрены вариабельные домены антител - белков, обладающих уникальным структурным разнообразием вариабельных петель.

19. Как перестать медитировать и начать моделировать (Артур Залевский, МГУ им. М. В. Ломоносова)

Большое количество данных, получаемых методом NGS, позволяет не только получать из этого биологические выводы, но и использовать их для моделирования. Построенные модели позволяют лучше понять биологические данные и получить еще больше биологического смысла из эксперимента. Лекция посвящена моделированию и начальным этапам этого процесса.

20*. Стоя на плечах гигантов, или зачем нужны консорциумы (Герман Демидов, Centre for Genomic Regulation, The Barcelona Institute of Science and Technology, Universitat Pompeu Fabra)

За последние десятилетия развитие биологии было связано с накоплением массивов данных, огромных настолько, что отдельные исследовательские группы уже не справлялись с их биоинформатическим анализом. С целью решить эту проблему начали создаваться консорциумы из десятков лабораторий, такие как Human Genome Project, 1000GP, ENCODE и другие. Благодаря таким коллаборациям, в открытом доступе есть данные разнообразных типов, полученные с помощью различных технологий. Как результат, сравнение новых экспериментальных данных с уже существующими стало стандартной частью любого исследования. Консорциумы производят не только данные, но и биоинформатические пайплайны для их обработки, и стандартные форматы, и процедуры оценки качества. На этой лекции обсуждается, как работают консорциумы, как пользоваться результатами их работы и что делать, если вы вдруг обнаружили себя членом такого консорциума и вам нужно обрабатывать терабайты данных, а потом обмениваться результатами со всеми остальными участниками.

21*. Обзор биоинформатических компаний в России и мире (Андрей Афанасьев, yRisk)

В современном мире наука и бизнес все более и более переплетаются. Не обошел этот тренд и область биоинформатики. Андрей рассказал об ожиданиях и реальности рынка, об историях успеха и историях провалов, о людях и местах, связанных с биоинформатикой.

22. Продвинутый анализ вариаций (SNV, InDel, SV) с помощью геномного браузера NGB (Геннадий Захаров, EPAM, Институт Физиологии им. И.П. Павлова, РАН)

Лекция охватывает процесс визуального анализа простых (SNV, InDel) и структурных вариаций в геномном браузере. Все примеры демонстрируются с использованием браузера NGB, отвечающего большинству требований и рекомендаций анализа структурных вариаций, в том числе различные виды визуализаций и получение аннотаций из внешних баз данных. В лекции на реальных примерах показаны сценарии валидации и анализа последствий простых и структурных вариаций. Добавить метки