Выпускники первой в РФ онлайн-программы «Магистр по наукам о данных» — об учебе в ВШЭ
Англоязычная магистратура Master of Data Science от факультета компьютерных наук НИУ ВШЭ, заручившись поддержкой индустриального партнера — компании «Яндекс», объединяет на платформе Вышки студентов более чем из 30 стран мира. Программа реализуется полностью в онлайн-формате. Среди выпускников второго набора программы — москвичка Любовь Шараборина и сингапурец Калвин Ти.
«Что 10 лет назад казалось фантастикой, сейчас реальность»
Заинтересовавшись сферой Natural Language Processing (NLP), дипломированный лингвист Любовь Шараборина решила получить высшее образование в сфере Data Science.
Любовь Шараборина
Почему вы решили изучать науки о данных именно в НИУ ВШЭ?
Я рассматривала несколько возможных программ обучения, в том числе долгосрочные курсы, но остановила свой выбор именно на Вышке. Master of Data Science — это полноценная очная магистратура, при этом удаленный формат позволял совмещать учебу с работой. Также решающим фактором стало то, что Вышка набирала студентов с любым бэкграундом (c бакалавриатом в любой сфере) при успешном прохождении вступительных испытаний, а программа охватывала все математические дисциплины — от дискретной математики до математической статистики.
Изучение наук о данных неразрывно связано с решением реальных кейсов индустрии. Насколько программа ориентирована на практические задачи?
Учеба построена таким образом, что все новые знания нужно обязательно интегрировать в практику, и подобных заданий давали очень много. Обучение требовало большой самостоятельной работы и изучения дополнительных материалов. Студенту без математической подготовки может быть сложнее, чем остальным. На выполнение заданий у меня уходило в среднем на 10 часов в неделю больше, чем у моих однокурсников. Мне было особенно интересно делать задания по алгоритмам и NLP. Но все без исключения задания оказались актуальными «боевыми» задачами, которые могут встретиться на собеседовании или в работе.
Чему посвящен ваш финальный проект?
Методам машинного чтения в задаче извлечения именованных сущностей (Named Entity Recognition). Это передовая технология, позволяющая извлекать полезную информацию из текста. На протяжении всей работы меня курировал научный руководитель, к которому всегда можно было обратиться с вопросом. Я была полностью уверена в качестве своего проекта, так что на защите ничего не боялась. Некоторые однокурсники даже писали научные статьи по своим исследованиям.
Удобно ли обучаться онлайн?
Удаленный формат учебы оказался для меня продуктивным: я могла слушать лекции и выполнять задания в удобное время. Дедлайны всегда держали в тонусе. Иногда после лекций возникали вопросы, их можно задать кураторам, посоветоваться с однокурсниками. У нас сложилась доброжелательная атмосфера, все были готовы помочь друг другу.
В каком направлении вы хотели бы расти?
Я преподаю Python, в будущем планирую развиваться как Data Scientist. Все так же хочу работать специалистом по NLP и продолжаю свой путь к мечте.
Науки о данных постоянно эволюционируют. Сейчас становится реальным то, что казалось фантастикой еще 5–10 лет назад. Например, в сфере NLP благодаря нейронным сетям стало возможным создавать реалистичные изображения на основе текста. Пример тому — нейронная сеть Imagen от Google — своего рода иллюстрации, которые говорят об очень высоком уровне понимания текста. Я думаю, что Data Science ждет бурный рост в обозримом будущем.
Программа Master of Data Science рассчитана на подготовку специалистов по трем направлениям:
Data Scientist — специалист по машинному обучению, способный решать как традиционные бизнес-задачи (прогнозирование спроса, предсказание оттока, анализ текстовых данных, сегментация и пр.), так и более современные постановки (построение вопросно-ответных систем, анализ изображений, генерация реалистичных примеров и пр.).
Machine Learning Engineer — специалист на стыке наук о данных и разработки, который понимает и профессионально использует современные технологии для сбора, хранения и анализа больших массивов данных, умеет писать эффективный код и проектировать сложные системы, связанные с сервисами на основе машинного обучения.
Researcher in DS — специалист по машинному обучению, знакомый со state-of-the-art-результатами, понимающий теоретические основы машинного обучения и способный заниматься улучшением существующих методов.
«Мы выполнили более 200 разномасштабных практических проектов и задач!»
Сингапурец Калвин Ти два года назад начал управлять данными в собственной логистической компании и решил получить фундаментальные знания в сфере Data Science и аналитики. По его словам, он стремился следить за исследованиями и разработками в этой области, но отраслевые тренинги и фрагментарное самообучение вне академической системы не позволяли создать адекватную базу знаний.
Калвин Ти
Почему вы выбрали Вышку для получения высшего образования в сфере Data Science?
Я определялся с вузом в разгар пандемии, когда из-за локдауна закрылись офисы и образовательные учреждения. Обучение, не предполагающее посещение кампуса университета, стало тогда особенно привлекательным. Я рассматривал различные программы, но силлабус MDS показался мне наиболее структурированным. Я оценил, что магистратура Вышки уделяла внимание математической базе, где у меня были пробелы.
Кроме того, мне импонировал энтузиазм академических лидеров и учебного офиса.
Чем вам запомнилась проектная работа?
Я насчитал, что за время учебы мы выполнили более 200 разномасштабных практических проектов и задач! Самыми интересными для меня стали те, что позволяли навести мосты между теорией и практической реализацией. Тут требовалось упорство, но взамен я приобрел бесценный опыт. Меня впечатлили инсайты, полученные в результате работы в исследовательской группе для моего финального проекта по детальному распознаванию домашних животных. Энергия и самоотверженность моего руководителя Николая Арефьева и товарищей по команде по-настоящему вдохновляли!
Обучение на этой программе проходит онлайн, но ты имеешь возможность общаться с однокурсниками, многие из которых — опытные практики. Полученные знания буду применять в текущей работе, а также планирую искать достойные проекты для укрепления профессиональной репутации. Карьерный трек думаю строить в сфере наук о данных.
Что было самым сложным во время учебы?
Балансировать между учебой, работой и семьей. Учиться приходилось допоздна, в том числе по выходным, без возможности проводить время с близкими и друзьями. Грамотный тайм-менеджмент требовал дисциплины. Пришлось сделать перестановку в квартире и организовать место для учебы, чтобы мне никто не мешал. Активное общение в чатах с однокурсниками из разных стран мира очень помогало, давало ощущение, что я не одинок в этом путешествии.
Будущим студентам программы я бы посоветовал записать на листке причины, почему вы решили учиться, и обращаться к этому списку каждый раз, когда вы теряете мотивацию. Учиться легче с оптимистичным настроем и активным вовлечением в коммуникацию. Заранее подумайте над темой финального проекта — ее поиск требует времени.
Дедлайн приема документов на программу «Магистр по наукам о данных» продлен до 19 августа.
Текст: Екатерина Зиньковская, Дирекция по онлайн-обучению НИУ ВШЭ