• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Звери, зарплаты и data leak: как разрабатываются задания для олимпиады школьников по ИИ

Звери, зарплаты и data leak: как разрабатываются задания для олимпиады школьников по ИИ

© Высшая школа экономики

В этом году участники Всероссийской олимпиады школьников по искусственному интеллекту впервые смогут зачесть ее результаты при поступлении в вузы. Елена Кантонистова, председатель методической комиссии олимпиады и академический руководитель онлайн-магистратуры факультета компьютерных наук «Машинное обучение и высоконагруженные системы», рассказала новостной службе «Вышка.Главное» о том, как ученые ВШЭ составляли задания для соревнований 2023 года, откуда взялась задача об уссурийских тиграх и почему школьникам полезно осваивать ИИ.

Во Всероссийской олимпиаде школьников по искусственному интеллекту могут участвовать ученики 8–11-х классов. Первые два этапа, отборочный и основной, проходят онлайн. Лучшие 50 участников, отобранные по их результатам, приезжают в Москву на заключительный очный финал.

В олимпиаде есть задания по математике, алгоритмам, машинному обучению. В 2023 году в отборочном и основном этапах было по два задания по каждому направлению. В отборочном этапе задания несложные и доступные всем участникам, добросовестно изучившим школьную программу по математике и информатике. В основном этапе задания уже сложнее, а в заключительном — всего две задачи по машинному обучению, но обе довольно непростые.

Елена Кантонистова

В прошлом году большинство членов методической комиссии, которая разрабатывает задания, были сотрудниками факультета компьютерных наук Вышки.

Расскажу подробнее о заданиях по машинному обучению, так как они представляют наибольший интерес и являются основными в олимпиаде. В 2023 году в отборочном этапе была классическая задача регрессии, то есть прогноз на основе набора данных с различными признаками. Участникам нужно было предсказать стоимость домов по различным характеристикам.

Вторая задача была посвящена несложному и интересному анализу данных. Летом один из российских заповедников предоставил нам данные о наблюдениях за животными: например, где и когда видели северных оленей, волков, уссурийских тигров, что они при этом делали и так далее. Участникам нужно было ответить на вопросы по этим данным, от несложных (сколько пропусков в данных, какой зверь встречается людям чаще всего) до довольно хитрых (например, какое животное было замечено осенью 2022 года ближе всего к центру Москвы или какое животное чаще всего уличают в кражах).

Такие несложные, но содержательные по смыслу задачи — очень хорошее подспорье, чтобы заинтересовать школьников, только начинающих свой путь в анализе данных. Для решения не нужно знать никаких сложных алгоритмов, но при этом придется поизучать данные и их особенности, чтобы получить ответ.

В основном этапе задачи были уже сложнее. Одна задача требовала построения рекомендательной системы: на основе информации о пользователях «ВКонтакте» нужно было порекомендовать им группы, которые могут им понравиться. Вторая задача тоже была нестандартная: по описанию вакансии спрогнозировать среднюю зарплату, которую будет получать сотрудник. Для решения этих задач уже нужно иметь опыт в решении разнообразных задач машинного обучения.

© Высшая школа экономики

Все задачи подобраны таким образом, чтобы от тура к туру их сложность возрастала. Кроме того, нам не хотелось повторяться в темах, поэтому все задачи были разнотипными и из разных областей. Наконец, самое непростое: так как олимпиада имеет статус всероссийской, то в ней не могут использоваться стандартные открытые наборы данных (датасеты). Необходимо было найти новые датасеты для задач, а это всегда большая проблема. В итоге, конечно, все разрешилось: какие-то данные члены методической комиссии собрали сами, а какие-то предоставили коллеги из больших технологических компаний (а также заповедник).

В заключительном этапе была одна относительно несложная задача — предсказать вероятность клика по рекламному объявлению (на табличных данных) — и одна очень интересная: image-text matching. Здесь нужно было обучить модель, которая по паре (картинка и текст) предсказывает степень их смыслового соответствия. Разработчики задач пытались поставить участников в ситуацию из реальной жизни, где данные не идеальны. Особенностями обеих задач был умышленный data leak (утечка данных). При нахождении утечки можно было значительно улучшить качество прогноза в задаче и подняться на первые позиции в рейтинге.

В итоге многие ребята успешно справились с задачами, и участники из топа рейтинга показали очень хорошие результаты.

Для школьников участие в этой олимпиаде не только интересно, но и полезно. Перед каждым этапом проходят подготовительные вебинары — их тоже проводила по большей части команда преподавателей ФКН. После окончания этапов проводились разборы заданий. Также участникам предоставили список материалов для изучения, чтобы им легче было справиться с заданиями олимпиады.

У команды разработчиков было много трудностей. Одна из основных — составить задачи так, чтобы их нельзя было решить современными генеративными моделями (речь, в частности, о ChatGPT). То есть сами задачи не должны быть стандартными, а также должны иметь формулировки, в которых разберется человек, но пока не разбираются генеративные модели. В прошлом году нам удалось составить такие задания. Дальше, конечно, будет сложнее.

В этом году олимпиада примет еще большие масштабы, так как ее результаты можно будет учесть для поступления в вузы. Мы надеемся поучаствовать в составлении заданий и для следующих олимпиад.

Вам также может быть интересно:

Студенты НИУ ВШЭ успешно защитили дипломы, в работе над которыми применили YandexGPT

Этим летом студенты нескольких направлений подготовки НИУ ВШЭ — «Философия», «Медиакоммуникации», «Международные отношения» и «Востоковедение» — впервые использовали нейросеть в процессе написания дипломных и курсовых работ. Университет разрешил применять возможности YandexGPT, генеративной технологии Яндекса, для решения заранее определённого перечня задач, на которые обычно у студента уходит много времени. Она помогала собирать, анализировать и обобщать информацию, проверять текст на ошибки и править оформление, а также разбираться в сложных темах и структурировать ход размышлений.

Интеллект искусственный и дополненный: связь бизнеса, образования и науки

Сегодня фраза «приручить искусственный интеллект» уже не звучит как суперспособность будущего. Эти технологии революционно меняют жизнь, от голосовых помощников и систем «умный дом» до создания цифровых двойников и секвенирования генома. О связи науки, бизнеса и образования в развитии искусственного интеллекта рассказала декан факультета информатики, математики и компьютерных наук НИУ ВШЭ – Нижний Новгород Наталья Асеева.

НИУ ВШЭ, Яндекс и ИТМО запустили аспирантуру в области ИИ и гранты для молодых ученых

НИУ ВШЭ в партнерстве с Яндекс создает первую аспирантуру по искусственному интеллекту с уклоном в практику (еще одну такую аспирантуру компания откроет в ИТМО). Цель — предложить лучшие условия и инфраструктуру для развития молодых ученых в стране. Каждый год обучения аспиранты будут получать гранты по 800 тысяч рублей, чтобы создавать новые технологии в области ИИ и быстро внедрять свои разработки на практике, в индустрии.

Вышка — в лидерах рейтинга вузов Альянса в сфере ИИ

Альянс в сфере искусственного интеллекта опубликовал новый рейтинг вузов России по качеству подготовки специалистов в области ИИ. Высшая школа экономики как и в прошлом году вошла в группу лидеров А+ вместе с МФТИ и ИТМО. Всего участниками рейтинга стали 207 университетов из 69 регионов страны. В 2024 году на профильные программы в области искусственного интеллекта этих вузов были приняты более 35 тыс. студентов.

В Вышке разрабатывают технологию идентификации текстов, сгенерированных ИИ любого типа

Ученые НИУ ВШЭ работают над созданием приложения, которое позволяет установить, написан текст человеком или сгенерирован искусственным интеллектом. Подход, на который опирается приложение, носит универсальный характер и позволяет «ловить» самых разных ботов, построенных на разной архитектуре. В ближайшее время запланировано тестирование прототипа в широком диапазоне текстов. Предполагается, что платформа будет доступна пользователям в 2025 году.

В питерской Вышке завершилась школа-конференция по ИИ

В НИУ ВШЭ — Санкт-Петербург прошла международная школа-конференция по искусственному интеллекту — ISSCAI 2024. Ее организовали Школа физико-математических и компьютерных наук совместно с Лабораторией социальной и когнитивной информатики при поддержке VK и других партнеров. В недельном интенсиве приняли участие талантливые студенты, аспиранты и разработчики со всей страны — от Москвы до Екатеринбурга, а также из Казахстана и Египта. Ведущие эксперты из России, ОАЭ и Индии прочли курсы по ключевым трендам в области ИИ: от компьютерного зрения до обработки музыкальных сигналов.

Искусственный интеллект как драйвер развития отечественной экономики

Для развития отечественной экономики и роста производительности труда сегодня необходимо активное внедрение технологий искусственного интеллекта (ИИ). Эту задачу можно решить только благодаря тесному сотрудничеству между бизнесом, наукой и образованием. Об этом шла речь на стратегической сессии НИУ ВШЭ по развитию ИИ.

В нижегородской Вышке запустили бакалавриат по искусственному и дополненному интеллекту

Студенты первой сетевой программы высшего образования по искусственному и дополненному интеллекту НИУ ВШЭ в Нижнем Новгороде будут изучать передовые технологии с участием экспертов BigTech-компаний. Меморандум о партнерстве в рамках реализации программы «Технологии искусственного и дополненного интеллекта» подписан между нижегородским кампусом Высшей школы экономики, АНО «НЕЙМАРК», Альфа-Банком и VK.

«Выпускники онлайн-магистратуры ВШЭ и “Яндекса” будут востребованы на горизонте многих лет»

Вышка открывает набор на совместную с “Яндексом” онлайн-магистратуру «Искусственный интеллект в маркетинге и управлении продуктом». Студенты будут изучать автоматизацию маркетинга, машинное обучение и ИИ, управление проектами и другие предметы. Академический руководитель онлайн-магистратуры, доцент департамента больших данных и информационного поиска факультета компьютерных наук ВШЭ Александр Тараканов, и академический руководитель со стороны “Яндекса”, эксперт в сфере маркетинговых образовательных технологий Дмитрий Еременко, рассказали, какие задачи ИИ помогает решать бизнесу и какие специалисты потребуются рынку в будущем.

НИУ ВШЭ первым из российских университетов разработал и утвердил Декларацию этических принципов использования ИИ

Высшая школа экономики стала первым университетом в России, утвердившим Декларацию этических принципов создания и использования систем искусственного интеллекта. Документ станет важным ориентиром для всех участников образовательного процесса, задавая высокие стандарты и способствуя формированию ответственного подхода к использованию искусственного интеллекта. Декларация была утверждена Ученым советом 26 июня.