• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Школа по ML в биоинформатике: «отличная возможность для нетворкинга и изучения нового материала»

Факультет компьютерных наук НИУ ВШЭ провел ежегодную летнюю школу по машинному обучению в биоинформатике, слушателями которой стали более 300 человек из разных университетов, институтов и организаций. Всего на событие зарегистрировались более 800 человек. Трехдневная программа включала в себя лекции и семинары.

В первый день участники могли узнать, откуда берется генетическое разнообразие, как большие языковые модели применяются в геномике и как такие модели создаются в биоинформатике. Во второй день школы спикеры рассказывали о биоинформатике в ДНК-тестированиях и о том, как она помогает выявлять заболевания, а также о вычислительных предсказаниях эффектов мутаций. В завершающий день поговорили о генеративных моделях в белковом дизайне и использовании белковой языковой модели для поиска B-клеточных эпитопов.

Спикерами выступили преподаватели и исследователи Международной лаборатории биоинформатики и Международной лаборатории статистической и вычислительной геномики ФКН ВШЭ, представители факультета биоинженерии и биоинформатики МГУ, а также МФТИ, AIRI, Genotek.

Слушатели и спикеры поделились впечатлениями от участия в летней школе и рассказали о своей сфере интересов в биоинформатике.

Мария Попцова, главный организатор школы, заведующая Международной лабораторией биоинформатики ФКН, академический руководитель магистратуры «Анализ данных в биологии и медицине»

— Эволюция архитектур нейросетевого глубинного обучения идет стремительными темпами. Речь о больших языковых и генеративных диффузионных моделях. В таком же темпе, с небольшим запозданием, происходит адаптация этих моделей к задачам биоинформатики.

На школе у нас получилось показать развитие двух направлений: применения больших языковых моделей к анализу геномов и белков, а также использования генеративных диффузионных моделей к генерации белковых минибайндеров — нового поколения лекарств.

Также мы гордимся тем, что в качестве лекторов удалось привлечь ведущих специалистов области.

Александр Ракитько, директор по науке Genotek

— Я уже не в первый раз участвую в летней школе по ML в биоинформатике, поэтому заранее был уверен, что все сложится. Быстро удалось наладить контакт с участниками, и почти сразу лекция превратилась в дискуссию. Время пролетело незаметно. Слушателям было интересно узнать о современных ДНК-тестах. Помимо лекции прошли и практические занятия. Удивлен, но некоторые ребята продолжили работать и делиться результатами уже после их завершения.

В мире больших данных легко оторваться от реальности и затеряться среди бесконечных нулей и единиц. Мне хотелось показать, что при определенных навыках и усердии можно достичь переднего края науки и решать задачи, которые важны и полезны людям.

Порадовала разнопрофильность участников школы: биологи с медиками, программисты, были и ребята, достигшие успехов в биоинформатике. Это важно, ведь, кроме сильного состава преподавателей и интересных лекций, весьма ценны знакомства и совместная работа с другими участниками. В такой среде рождаются стартапы и многолетние коллаборации.

Я бы хотел пожелать участникам школы использовать полученные знания как ориентир для выбора будущей профессии. Конечно, не все из них станут биоинформатиками. Но надеюсь, многие будут вспоминать школу как хороший и полезный опыт.

Дмитрий Пензар, преподаватель факультета биоинженерии и биоинформатики МГУ, научный сотрудник AIRI

— Я занимаюсь машинным обучением в регуляторной геномике уже семь лет и на летней школе хотел погрузить участников в эту область. Перспективы у сферы огромные — без успехов в ней о доступной персонализированной медицине можно забыть. При этом из-за ИИ-хайпа и не до конца честных статей невозможно самостоятельно понять, какие задачи в области решены.

Если коротко — нормально решенных задач нет. Особенно если ставить планки вида AlphaFold2. Любые разумные требования геномными моделями выполняются плохо. Но отсутствие решения — это не плохо, а, наоборот, хорошо, ведь есть возможность быть именно тем, кто это решение найдет.

На лекции мы обсудили, как нам могут помочь ДНК-языковые модели, одноклеточные данные, персонифицированные геномы и то, на чем я фокусировался в ходе докторантуры, — массовые параллельные эксперименты с репортерами. Также на примере архитектуры LegNet от нашей лаборатории мы обсудили, каким деталям стоит уделять внимание при решении биологических задач.

Любая область науки требует уважения к себе. Ошибка многих специалистов по машинному обучению, приходящих в ML в биологии, — наплевательское отношение к биологии. Ошибка биологов — восприятие машинного обучения как готового инструмента, который надо взять наугад из чьей-то статьи и запустить, не пытаясь разобраться.

Если хочется делать хорошую работу в нашей области, надо быть внимательным и к биологическим, и к ML-мелочам.

Дмитрий Умеренков, AIRI

— Приятно пообщаться с таким количеством молодых и увлеченных студентов. Огромное спасибо организаторам за предоставленную возможность.

В дополнение к нашей лекции мы подготовили практическое задание для участников, предложили им оценить качество двух реальных вакцин от COVID-19, чтобы наглядно продемонстрировать важность и ответственность задач, стоящих сегодня перед биоинформатиками.

Желаю участникам активнее вовлекаться в проекты, которые их действительно интересуют.

Марк Мирный, студент 4-го курса бакалавриата Института биологии и биотехнологии ВятГУ

— Было интересно поучаствовать в летней школе. Мне как «мокрому» биологу (ученый, работающий в лаборатории с реактивами. — Ред.) многое было непонятно, но ведущие секций отвечали на все интересующие вопросы. Эта школа — отличная возможность для нетворкинга и изучения нового материала. Надеюсь, смогу принять участие в следующем году.

Александра Кривицкая, младший научный сотрудник группы молекулярного моделирования федерального исследовательского центра «Фундаментальные основы биотехнологии» РАН

— Я считаю, что эта школа полезна как начинающим специалистам, так и состоявшимся специалистам из других областей. Первые получают необходимые вводные материалы для дальнейшей работы, вторые — информацию, чтобы иметь представление о развитии смежной области знаний. Для меня школа оказалась очень полезной. Большое спасибо за организацию такого мероприятия!

Евгений Бойко, студент 2-го курса ОП «Программная инженерия» ФКН

— Биоинформатика мне интересна как сочетание ML-технологий с генетикой, которое еще и имеет прикладной характер.

Больше всего мне понравился последний день школы, так как спикеры не только хорошо провели лекции, но и дали попрактиковаться. Интересная практическая часть была у Александра Ракитько: там и покодить дали возможность, и поработать с биологическими базами.

В будущем хотелось бы, чтобы на школе организовали больше разной практики. Мне кажется, это еще сильнее вовлекло бы слушателей в процесс.