• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • A
  • A
  • A
  • A
  • A
Обычная версия сайта
  • RU
  • EN
  • Национальный исследовательский университет «Высшая школа экономики»
  • Публикации ВШЭ
  • Препринты
  • A Novel Psychometrics-Based Approach to Developing Professional Competency Benchmark for Large Language Models
  • RU
  • EN
Расширенный поиск
Высшая школа экономики
Национальный исследовательский университет
Приоритетные направления
  • бизнес-информатика
  • государственное и муниципальное управление
  • гуманитарные науки
  • инженерные науки
  • компьютерно-математическое
  • математика
  • менеджмент
  • право
  • социология
  • экономика
по году
  • 2027
  • 2026
  • 2025
  • 2024
  • 2023
  • 2022
  • 2021
  • 2020
  • 2019
  • 2018
  • 2017
  • 2016
  • 2015
  • 2014
  • 2013
  • 2012
  • 2011
  • 2010
  • 2009
  • 2008
  • 2007
  • 2006
  • 2005
  • 2004
  • 2003
  • 2002
  • 2001
  • 2000
  • 1999
  • 1998
  • 1997
  • 1996
  • 1995
  • 1994
  • 1993
  • 1992
  • 1991
  • 1990
  • 1989
  • 1988
  • 1987
  • 1986
  • 1985
  • 1984
  • 1983
  • 1982
  • 1981
  • 1980
  • 1979
  • 1978
  • 1977
  • 1976
  • 1975
  • 1974
  • 1973
  • 1972
  • 1971
  • 1970
  • 1969
  • 1968
  • 1967
  • 1966
  • 1965
  • 1964
  • 1963
  • 1958
  • еще
Тематика
Новости
8 июня 2026 г.
«За 12 лет на нашем счету почти 1000 операций с пробуждением»
В НИУ ВШЭ прошла XIII Летняя нейролингвистическая школа, организованная Центром языка и мозга при поддержке факультета гуманитарных наук НИУ ВШЭ. В центре внимания слушателей была совместная работа нейролингвистов, нейрохирургов и нейрофизиологов в операционной, стандартизация лингвистических парадигм и практические подходы к сохранению речевой функции пациентов.
5 июня 2026 г.
Аспирантка НИУ ВШЭ открыла «невидимую» планировку античного Париона
Исследовательница из НИУ ВШЭ Идиль Малгиль изучила с помощью дрона с лазерным сканером сверхвысокого разрешения древнеримский город Парион, расположенный на территории современной Турции. Благодаря высокой плотности сканирования удалось зафиксировать крошечные неровности рельефа, скрытые под землей и растительностью. Обнаружены следы целых кварталов, террасных систем и стен, которые невозможно было различить ни при обычных раскопках, ни с помощью аэрофотосъемки. Результаты исследованияо публикованы в международном научном журнале Ancient Civilizations from Scythia to Siberia.
2 июня 2026 г.
От Волги до Янцзы: математики из Нижнего Новгорода и Шанхая изучают устойчивость систем
Математики НИУ ВШЭ в Нижнем Новгороде совместно с коллегами из шанхайского Университета Тунцзи исследуют фундаментальные причины структурной устойчивости систем и механизмы их нарушения. О развитии проекта Qualitative Theory of Systems of Ordinary and Partial Differential Equations в рамках программы НИУ ВШЭ «Международное академическое сотрудничество» «Вышке.Главное» рассказала его руководитель, профессор Ольга Починка, заведующая Международной лабораторией динамических систем и приложений НИУ ВШЭ в Нижнем Новгороде.


 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!

Публикации
  • Книги
  • Статьи
  • Главы в книгах
  • Препринты
  • Верификация публикаций
  • Расширенный поиск
  • Правила использования материалов
  • Наука в ВШЭ

?

A Novel Psychometrics-Based Approach to Developing Professional Competency Benchmark for Large Language Models

2024.
Карданова Е. Ю., Иванова А. Е., Тарасова К. В., Пащенко Т. В., Tikhoniuk A., Юсупова Э. М., Каспржак А. Г., Кузьминов Я. И., Кручинская Е. В., Brun I.
The era of large language models (LLM) raises questions not only about how to train models, but also about how to evaluate them. Despite numerous existing benchmarks, insufficient attention is often given to creating assessments that test LLMs in a valid and reliable manner. To address this challenge, we accommodate the Evidence-centered design (ECD) methodology and propose a comprehensive approach to benchmark development based on rigorous psychometric principles. In this paper, we have made the first attempt to illustrate this approach by creating a new benchmark in the field of pedagogy and education, highlighting the limitations of existing benchmark development approach and taking into account the development of LLMs. We conclude that a new approach to benchmarking is required to match the growing complexity of AI applications in the educational context. We construct a novel benchmark guided by the Bloom's taxonomy and rigorously designed by a consortium of education experts trained in test development. Thus the current benchmark provides an academically robust and practical assessment tool tailored for LLMs, rather than human participants. Tested empirically on the GPT model in the Russian language, it evaluates model performance across varied task complexities, revealing critical gaps in current LLM capabilities. Our results indicate that while generative AI tools hold significant promise for education - potentially supporting tasks such as personalized tutoring, real-time feedback, and multilingual learning - their reliability as autonomous teachers' assistants right now remain rather limited, particularly in tasks requiring deeper cognitive engagement.
Научное направление: Образование Компьютерные науки Прочие социальные науки
Приоритетные направления: компьютерно-математическое
Язык: английский
Полный текст
DOI
Текст на другом сайте
Ключевые слова: тестированиепрофессиональные компетенцииtestingпсихометрикаpsychometricsprofessional competenceLLMбольшие языковые модели
Похожие публикации
Понятие образовательной услуги в российском законодательстве
Линская Ю. В., Вестник Санкт-Петербургского университета. Серия 14. Право 2023 № 4 С. 844–853
В статье рассмотрено понятие «образовательная услуга» в контексте возникшей общественной дискуссии о возможности его использования применительно к образованию и образовательным отношениям. Рассмотрена текущая ситуация с постепенным отказом от термина в действующем образовательном законодательстве, что соответствует положениям новой редакции Конституции РФ и политике в области традиционных духовно-нравственных ценностей, но не является достаточно действенной мерой для решения ...
Добавлено: 5 июня 2026 г.
Научно-практический комментарий к Закону об образовании в Российской Федерации
Издательство Санкт-Петербургского университета, 2023.
В книге анализируется практика применения Федерального закона от 29.12.2012 № 273-ФЗ «Об образовании в Российской Федерации» за десятилетний период. Авторы показывают действие норм закона, определяющих новые либо обновленные институты: уровневый подход к образованию; единый статус обучающегося; разделение субъектов на образовательные организации и организации, осуществляющие образовательную деятельность; порядок осуществления государственного контроля и надзора в сфере образования ...
Добавлено: 5 июня 2026 г.
Системы управления высшим образованием в России и Китайской Народной Республике: сравнительно-правовой аспект
Линская Ю. В., Вестник Санкт-Петербургского университета. Серия 14. Право 2025 Т. 16 № 2 С. 439–455
В статье сравниваются системы управления высшим образованием в Российской Федерации и Китайской Народной Республике (КНР), особенности правового регулирования и государственные программы поддержки высшего образования. В последние годы между двумя странами развивается динамичное взаимодействие и партнерство практически во всех сферах жизни, включая образование. Лица, обладающие знаниями не только китайского языка, но и права, экономики, крайне востребованы ...
Добавлено: 5 июня 2026 г.
МОДЕЛЬ МАГИСТРАТУРЫ НА ОСНОВЕ ЗАДАЧНО-МОДУЛЬНОГО ПОДХОДА И АВТОМАТИЗИРОВАННОЙ ОЦЕНКИ ОБРАЗОВАТЕЛЬНЫХ РЕЗУЛЬТАТОВ
Адамский А. И., Колачев Н. И., Подболотова М. И. и др., М.: МГПУ, 2026.
Монография раскрывает концептуальный и технологический аспекты задачномодульного подхода к построению образовательной программы магистратуры, опосредованного использованием искусственного интеллекта для автоматизации оценивания компетентности обучающихся. Издание предназначено для руководителей и преподавателей магистратуры, ориентировано на подготовку кадров для сферы образования. Может быть использовано в качестве учебного материала для слушателей курсов повышения квалификации и профессиональной переподготовки. ...
Добавлено: 5 июня 2026 г.
Proceedings of the 43rd International Conference on Machine Learning (ICML 2026)
Seul: PMLR, 2026.
Добавлено: 4 июня 2026 г.
Путевые заметки участников экспедиционного выезда группы «Социокультурная психология и антропология» (Республика Бурятия, 2025 год)
Обухов А. С., Вершок О., Володина В. и др., Исследователь/Researcher 2025 № 3-4 С. 300–339
Статья представляет собой обобщение путевых заметок участников экспедиционной группы «Социокультурная психология и антропология» Школы № 1553 имени В. И. Вернадского в Бурятию летом 2025 года. Исследования велись в улусе Улюнхан в верховье Баргузина, а итоговая конференция — в п. Танхой на берегу Байкала. Текст таких путевых заметок описывает в большей мере самих подростков, а не ...
Добавлено: 2 июня 2026 г.
Итоги экспедиции «Человек в гармонии с природой: взаимодействие школ Республики Бурятия с особо охраняемыми природными территориями»
Обухов А. С., Исследователь/Researcher 2025 № 3-4 С. 83–131
Описан опыт подготовки и реализации студенческой исследовательской экспедиции в Бурятию в рамках программы «Открываем Россию заново» НИУ ВШЭ на тему «Человек в гармонии с природой: взаимодействие школ Республики Бурятия с особо охраняемыми природными территориями». Экспедиция подготовлена и реализована в сотрудничестве с БГУ имени Д. Банзарова в четырех локациях Республики Бурятии, где разные типы особо охраняемых ...
Добавлено: 2 июня 2026 г.
Феномен устойчивых во времени неформальных разновозрастных сообществ, осуществляющих воспитательную работу с подростками
Обухов А. С., Кириллова К. Б., Исследователь/Researcher 2025 № 3-4 С. 26–48
Исследуется феномен устойчивости неформальных разновозрастных сообществ, осуществляющих воспитательную работу с подростками. Выявляются условия создания и факторы устойчивости таких сообществ на примере трех организаций: отряда «Надежда», ДЮО «Остров сокровищ» и отряда «Каравелла». В качестве основного метода исследования выбран кейс-стади с использованием качественных методов сбора эмпирических данных: включенного наблюдения, глубинных интервью с участниками сообществ и анализа цифрового ...
Добавлено: 2 июня 2026 г.
Байкал в центре мироздания
Обухов А. С., Исследователь/Researcher 2025 № 3-4 С. 10–15
Во вступительной статье к выпуску журнала по теме «Природа и культура Бурятии», в котором представлены результаты нескольких экспедиций как в Республику Бурятия, так и в Иркутскую область, дается вводный обзор основной проблематики публикуемых материалов в номере журнала. Он содержит обзор по основной теме номера — «Природа и культура Бурятии», а также таким подтемам, как «Конкурс ...
Добавлено: 2 июня 2026 г.
OpenAtom Foundation. Консорциум, развивающий Open Source в Китае.
Силаков Д. В., Системный администратор 2026 № 3 С. 28–33
В статье про платформы для разработки открытого ПО в Китае мы рассказали про GitCode – молодой проект, позиционируемый как площадка для разработчиков со всего мира. Сейчас на GitCode размещаются проекты, созданные в КНР, но некоторые из них уже известны и на международной арене. Помочь открытым проектам в становлении, развитии и расширению аудитории призван фонд OpenAtom ...
Добавлено: 2 июня 2026 г.
Education Policy and Urban-Rural Disparities in Schooling in Post-Soviet Countries
Искакова Б. С., Косарецкий С. Г., Заир-Бек С. И. и др., Journal of Economic Sociology 2026 Vol. 27 No. 3 P. 99–128
Добавлено: 1 июня 2026 г.
Заповедник как школа: как на Байкале учат любить и понимать природу
Трофимов В. В., Обухов А. С., Исследователь/Researcher 2025 Т. 51-52 № 3-4 С. 144–152
Статья посвящена анализу опыта экологического просвещения, реализуемого на базе особо охраняемых природных территорий (ООПТ) Республики Бурятия. Материал подготовлен по итогам экспедиции в рамках проекта НИУ ВШЭ «Открываем Россию заново». На основе интервью с сотрудниками заповедников и национальных парков выявлены ключевые принципы их работы: непрерывность обучения, партнерская модель взаимодействия с местными сообществами, опора на практический опыт ...
Добавлено: 1 июня 2026 г.
Анализ культурных референций в творчестве А. Вознесенского: цифровое исследование имен персоналий
Тюрякова-Матвеева Д. В., Цифровые гуманитарные исследования 2026 № 1 С. 4–26
Статья исследует культурные референции в творчестве Андрея Вознесенского путем анализа упоминаемых им персоналий. Обработано 1678 произведений, включая поэзию, прозу и ранние неопубликованные стихотворения. Методы NER, основанные на инструментах Natasha, spaCy и LLM Grok, позволили изучить частоту упоминания известных лиц и их связь с жанром произведения. Определены ключевые авторы Вознесенского (Пастернак, Пушкин, Маяковский), выявлены особенности жанра ...
Добавлено: 31 мая 2026 г.
The recognition-by-components method
Slivnitsin P., Мыльников Л. А., Engineering Applications of Artificial Intelligence 2026 Vol. 179 Article 115185
Добавлено: 29 мая 2026 г.
Инновационные технологии в образовательной деятельности: материалы XXVIII Международной научно-методической конференции, г. Н. Новгород, 5.02.2026 г.
Н. Новгород: Нижегородский государственный технический университет им. Р.Е. Алексеева, 2026.
Материалы конференции систематизированы по следующим направлениям:  реформирование системы образования, качественные и содержательные стороны образовательного процесса;  фундаментальная подготовка студентов: проблемы и перспективы;  актуальные проблемы изучения иностранного языка в техническом вузе. ...
Добавлено: 29 мая 2026 г.
В поисках утраченного Поля: Антиметодичка
Алхимов А. П., Виноградова М., Гончаренко Д. и др., СПб.: НИУ ВШЭ - Санкт-Петербург, 2025.
Книга написана в жанре анти-методички по полевой этнографии и обращена «от студента — к студенту». Все главы объединяет стремление авторов поделиться своим полевым опытом, в рамках которого возникали не только трудности, препятствия, но и радостные открытия, побеждали находчивость или вера в себя. Вводный раздел посвящен поиску границ и природы «поля» в социальной антропологии, тогда как ...
Добавлено: 29 мая 2026 г.
ML-based Fast Simulation of FARICH Responses
Шипилов Ф. А., Barnyakov A., Ivanov A. и др., / Series Physics "arxiv.org". 2026.
Добавлено: 19 мая 2026 г.
Optimizing Computational Infrastructure for Large Language Models in Bioinformatics: A Case Study
Бекназаров Н. С., , in: Parallel Computational Technologies, 19th International Conference, PCT 2025, Moscow, Russia, April 8–10, 2025, Revised Selected Papers. (CCIS, volume 2891)Vol. 2891.: Springer, 2026. P. 3–16.
Добавлено: 19 мая 2026 г.
Персонализированная обратная связь на основе искусственного интеллекта: модель для магистратуры гуманитарного профиля
Подболотова М. И., Адамский А. И., Колачев Н. И. и др., Высшее образование в России 2026 Т. 35 № 4 С. 21–35
Цель статьи – представить и обосновать педагогическую модель персонализированной обратной связи на основе больших языковых моделей (LLM) для образовательного процесса в магистратуре гуманитарного профиля. Актуальность исследования обусловлена задачами цифровой трансформации высшего образования в РФ, обозначенными в указе Президента № 474 от 21.07.2021 «О национальных целях развития до 2030 года», и необходимостью внедрения гибких, адаптивных образовательных ...
Добавлено: 4 мая 2026 г.
Natural hazard database from Internet publications: text mining with a large language model
Деркачева А. А., Сакиркина М. А., Краев Г. Н. и др., /. 2026.
Добавлено: 28 апреля 2026 г.
Об идеологических предвзятостях генеративного ИИ: Российско-украинский конфликт в репрезентации ChatGPT
Байша О. А., Трофимов В. В., Российская школа связей с общественностью 2026 № 40 С. 171–191
Все большее количество ученых предупреждает об опасности воспроизведения генеративным ИИ социально-политических и идеологических предрассудков, впитанных моделями из текстов, на которых они обучались. Если, например, та или иная модель тренировалась на материалах западных СМИ, она может генерировать нарративы, воспроизводящие западноцентричный взгляд на мировые события. Это проявляется в репродукции определений глобальных проблем, нормализированных в западных гегемонистских дискурсах. ...
Добавлено: 21 апреля 2026 г.
Algorithmic overlaps as thermodynamic variables: from local to cluster Monte Carlo dynamics in critical phenomena
Пиле Я. Э., Deng Y., Щур Л. Н., / Series arXiv "math". 2026. No. 2604.10254.
Добавлено: 20 апреля 2026 г.
Цифровые инструменты в развитии культурного интеллекта и иноязычных коммуникативных умений студентов-международников
Лукашенко А. Д., Непрерывное образование: XXI век 2026 Т. 14 № 1 С. 82–98
Аннотация: статья посвящена актуальной проблеме развития культурного интеллекта (CQ) у студентов-международников в процессе обучения иностранному языку. В условиях глобализа ции и цифровизации CQ рассматривается не как факультативный мягкий навык, а как базовая профессиональная компетенция, необходимая для эффективного взаимодействия в поликультур ной среде. Целью исследования являются теоретическое обоснование и разработка методиче ских рекомендаций по интеграции целенаправленного ...
Добавлено: 5 апреля 2026 г.
Using predefined vector systems to speed up neural network multimillion class classification
Gabdullin N., Андросов И. А., / Series Computer Science "arxiv.org". 2026.
Добавлено: 2 апреля 2026 г.
  • О ВЫШКЕ
  • Цифры и факты
  • Руководство и структура
  • Устойчивое развитие в НИУ ВШЭ
  • Преподаватели и сотрудники
  • Корпуса и общежития
  • Закупки
  • Обращения граждан в НИУ ВШЭ
  • Фонд целевого капитала
  • Противодействие коррупции
  • Сведения о доходах, расходах, об имуществе и обязательствах имущественного характера
  • Сведения об образовательной организации
  • Людям с ограниченными возможностями здоровья
  • Единая платежная страница
  • Работа в Вышке
  • ОБРАЗОВАНИЕ
  • Лицей
  • Довузовская подготовка
  • Олимпиады
  • Прием в бакалавриат
  • Вышка+
  • Прием в магистратуру
  • Аспирантура
  • Дополнительное образование
  • Центр развития карьеры
  • Бизнес-инкубатор ВШЭ
  • Образовательные партнерства
  • Обратная связь и взаимодействие с получателями услуг
  • НАУКА
  • Научные подразделения
  • Исследовательские проекты
  • Мониторинги
  • Диссертационные советы
  • Защиты диссертаций
  • Академическое развитие
  • Конкурсы и гранты
  • Внешние научно-информационные ресурсы
  • РЕСУРСЫ
  • Библиотека
  • Издательский дом ВШЭ
  • Книжный магазин «БукВышка»
  • Типография
  • Медиацентр
  • Журналы ВШЭ
  • Публикации
  • http://www.minobrnauki.gov.ru/
    Министерство науки и высшего образования РФ
  • https://edu.gov.ru/
    Министерство просвещения РФ
  • http://www.edu.ru
    Федеральный портал «Российское образование»
  • https://elearning.hse.ru/mooc
    Массовые открытые онлайн-курсы
  • НИУ ВШЭ1993–2026
  • Адреса и контакты
  • Условия использования материалов
  • Политика конфиденциальности
  • Правила применения рекомендательных технологий в НИУ ВШЭ
  • Карта сайта
Редактору