• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • A
  • A
  • A
  • A
  • A
Обычная версия сайта
  • RU
  • EN
  • Национальный исследовательский университет «Высшая школа экономики»
  • Публикации ВШЭ
  • Глава
  • Correcting or Rewriting? An Expert Evaluation of LLM-Based GEC on Academic Learner Data
  • RU
  • EN
Расширенный поиск
Высшая школа экономики
Национальный исследовательский университет
Приоритетные направления
  • бизнес-информатика
  • государственное и муниципальное управление
  • гуманитарные науки
  • инженерные науки
  • компьютерно-математическое
  • математика
  • менеджмент
  • право
  • социология
  • экономика
по году
  • 2027
  • 2026
  • 2025
  • 2024
  • 2023
  • 2022
  • 2021
  • 2020
  • 2019
  • 2018
  • 2017
  • 2016
  • 2015
  • 2014
  • 2013
  • 2012
  • 2011
  • 2010
  • 2009
  • 2008
  • 2007
  • 2006
  • 2005
  • 2004
  • 2003
  • 2002
  • 2001
  • 2000
  • 1999
  • 1998
  • 1997
  • 1996
  • 1995
  • 1994
  • 1993
  • 1992
  • 1991
  • 1990
  • 1989
  • 1988
  • 1987
  • 1986
  • 1985
  • 1984
  • 1983
  • 1982
  • 1981
  • 1980
  • 1979
  • 1978
  • 1977
  • 1976
  • 1975
  • 1974
  • 1973
  • 1972
  • 1971
  • 1970
  • 1969
  • 1968
  • 1967
  • 1966
  • 1965
  • 1964
  • 1963
  • 1958
  • еще
Тематика
Новости
26 июня 2026 г.
«Культурологи пытаются увидеть, что скрывается за поверхностью обычных вещей»
Максим Жиганов много лет исследует разные стороны звука — сначала в привязке к своей родной Перми, а затем в более глобальных масштабах. В интервью проекту «Молодые ученые Вышки» он рассказал о звуковых картах, тематическом номере журнала «Логос» и о том, зачем делать привычное менее понятным и очевидным.
26 июня 2026 г.
В НИУ ВШЭ разработали приложение для диагностики фонологической обработки у детей
Специалисты Центра языка и мозга НИУ ВШЭ представили новый цифровой инструмент для оценки навыков фонологической обработки у детей — батарею тестов «ЗАРЯ» («Звуковой анализ русского языка»). Это первое в России стандартизированное приложение, позволяющее быстро и надежно выявлять нарушения способности различать звуки речи, удерживать их в оперативной памяти и проводить фонематический анализ. Программа работает на планшетах и смартфонах с операционной системой Android, доступна для скачивания в RuStore. Детали валидации теста опубликованы в Journal of Speech, Language, and Hearing Research.
24 июня 2026 г.
Древняя чашекрания - новый вид брахиопод с необычной формой раковины и образом жизни
Российские ученые из Высшей школы экономики, МГУ имени М.В. Ломоносова и Таллинского технического университета изучили ископаемый вид древних брахиопод (плеченогих), который обитал в теплом море на севере современной Эстонии более 445 миллионов лет назад. Древняя брахиопода росла в форме чашки со «шляпкой», чтобы защититься от зарастания. Исследование опубликовано в журнале Palaeogeography, Palaeoclimatology, Palaeoecology.

 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!

Публикации
  • Книги
  • Статьи
  • Главы в книгах
  • Препринты
  • Верификация публикаций
  • Расширенный поиск
  • Правила использования материалов
  • Наука в ВШЭ

?

Correcting or Rewriting? An Expert Evaluation of LLM-Based GEC on Academic Learner Data

P. 1–10.
Копылова Е. В., Цегоева О. Г., Берлин В. А., Выренкова А. С., Кувшинская Ю. М.

Данная статья посвящена исследованию того, как большие языковые модели исправляют сложные
грамматические ошибки в академических учебных текстах на русском языке. В отличие от традиционныхGEC-систем, которые руководствуются принципом минимального исправления, большие языковые модели(LLM) часто применяют генеративные стратегии переписывания, которые могут улучшить восприятие
текста, однако появляется риск гиперкоррекции структуры и семантических изменений. Мы представляем
новый экспертный бенчмарк, основанный на русском учебном корпусе из 3,1 млн слов, и создаем оценочную
систему, аннотированную по типу ошибки и сложности.Мы предлагаем систему оценивания, основанную на экспертных суждениях и сочетающую в себе
количественный анализ, исследование изменения структуры и слепое попарное сравнение. Результаты
выявляют баланс между минимальными исправлениями и генеративным подходом LLM. Это оказывает
прямое влияние на оценивание, так как референсные метрики могут недооценивать структурную
гиперкоррекцию и не учитывать разницу в подходах к исправлению.

Язык: английский
DOI
Текст на другом сайте
Ключевые слова: система оценкиучебный корпусLearner Corpus(LC)evaluation frameworkGECLLMsLLMRussian academic writingGECрусское академическое письмо
ПУБЛИКАЦИЯ ПОДГОТОВЛЕНА ПО РЕЗУЛЬТАТАМ ПРОЕКТА:
Языковое и когнитивное многообразие в формальных моделях, компьютерных инструментах и образовательных ресурсах (2025)

В книге

Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной международной конференции «Диалог». Выпуск 24.
Issue 24. , M.: Max press, 2026.
Похожие публикации
Анализ культурных референций в творчестве А. Вознесенского: цифровое исследование имен персоналий
Тюрякова-Матвеева Д. В., Цифровые гуманитарные исследования 2026 № 1 С. 4–26
Статья исследует культурные референции в творчестве Андрея Вознесенского путем анализа упоминаемых им персоналий. Обработано 1678 произведений, включая поэзию, прозу и ранние неопубликованные стихотворения. Методы NER, основанные на инструментах Natasha, spaCy и LLM Grok, позволили изучить частоту упоминания известных лиц и их связь с жанром произведения. Определены ключевые авторы Вознесенского (Пастернак, Пушкин, Маяковский), выявлены особенности жанра ...
Добавлено: 31 мая 2026 г.
Оценка качества использования больших языковых моделей в задачах машинного перевода
Мыльникова А. В., Мыльников Л. А., Научно-техническая информация. Серия 2: Информационные процессы и системы 2026 № 2 С. 24–33
Представлены результаты сравнительной оценки качества машинного перевода, выполненного большими языковыми моделями (LLM): DeepSeek, Grok, Mistral, Qwen, GigaChat, Yandex, на основе перевода выразительных языковых средств (фразеологизмов, омонимов, каламбуров и т.д.) и текстов различных функциональных стилей. Качество перевода оценивалось количественно с помощью метрик когерентности (BLEU, METEOR, chrF) и качественно — путем экспертного анализа на соответствие критериям адекватности, ...
Добавлено: 27 февраля 2026 г.
RuCLEVR: A Russian Diagnostic Dataset for Compositional Language and Elementary Visual Reasoning
Biryukova K., Chelnokova D., Erkenova J. и др., Communications in Computer and Information Science 2024 Vol. 2364 CCIS P. 109 – 121
Добавлено: 25 февраля 2026 г.
Mechanistic Permutability: Match Features Across Layers
Balagansky N., Максимов Я. В., Gavrilov D., , in: Proceedings of the 13th International Conference on Learning Representations (ICLR 2025).: ICLR, 2025. P. 57940–57957.
Добавлено: 25 февраля 2026 г.
Применение больших языковых моделей для анализа ценностно-патриотического дискурса русскоязычных пользователей
Балакина Ю. В., Григорьева М. В., Соколова Е. Н., Вестник Российского фонда фундаментальных исследований. Гуманитарные и общественные науки 2025 Т. 123 № 4 С. 56–69
Статья рассматривает возможности применения больших языковых моделей (LLM) для автоматизированного анализа ценностно-патриотического дискурса русскоязычных пользователей социальных медиа. На материале корпуса сообщений из VK, «Одноклассников» и Telegram (2023–2025 гг.) исследуется, насколько результаты автоматической кодировки совпадают с экспертной разметкой по специально разработанной категориальной схеме. Кодбук включает восемь измерений: базовые ценности по Ш. Шварцу, две оси Р. Инглхарта ...
Добавлено: 26 ноября 2025 г.
Дискурсивные возможности больших языковых моделей при решении задач генерации новых текстов
Мыльникова А. В., Гасимов А. Р., Научно-техническая информация. Серия 2: Информационные процессы и системы 2025 № 9 С. 33–38
На основе изучения функционирования больших языковых моделей (LLMs) и специфических характеристик машинной обработки дискурса показано применение экспериментального метода компьютерного и лингвистического анализа для статистического исследования и интерпретации лингвистических характеристик текстов. В качестве материалов исследования использован лингвистический корпус текстов Brown, а также корпуса искусственно сгенерированных текстов с применением Claude Sonnet 3.7 и Grok-3. В механизмах обработки ...
Добавлено: 19 ноября 2025 г.
Исследования благополучия с помощью передовых методов обработки естественного языка (NLP): перспективы и ограничения
Воеводина Е. Ю., Современная зарубежная психология 2025 Т. 14 № 3 С. 172–181
Контекст и актуальность. Исследования благополучия столкнулись с противоречиями и ограничениями, проистекающими из ограничений метода психометрических самоотчетных шкал. Данные методы критикуются за низкую экологическую валидность, ограниченную информативность и трудности в операционализации комплексного конструкта благополучия. В то же время, стремительное развитие технологий обработки естественного языка (natural language processing, NLP) открывает новые возможности для преодоления этих ограничений. Цель. Провести обзор ...
Добавлено: 9 октября 2025 г.
Языковые модели для предобработки текстов в машинном переводе
Мыльникова А. В., Мыльников Л. А., Научно-техническая информация. Серия 2: Информационные процессы и системы 2025 № 7 С. 32–44
Рассмотрена модель использования скелетных структур на базе синтаксической разметки для предобработки корпусов текстов перед передачей в нейросетевые модели машинного перевода с целью повышения качества их работы, реализованная с помощью частеречной и синтаксической разметок корпусов текстов, использующих языковую модель, с использованием сети BERT и набора правил. Описана подготовка данных для обучения и предложены способы повышения эффективности ...
Добавлено: 22 сентября 2025 г.
Оценка моделей LLM по степени готовности решать задачи управления в области ESG
Сторчевой М. А., Мыльников Л. А., Чернышев В. В. и др., / SSRN. Серия "Working Papers". 2025.
Внимание к охране природы принимает все большую значимость для бизнеса с одной стороны в связи с ужесточением в природоохранном законодательстве, а с другой в связи с использованием ESG рейтингов при принятии решений о коммерческой деятельности компаний. Составление рейтинга LLM систем, способных оказывать консультационные услуги в области природоохраны и ESG, позволяет осуществить выбор такой системы для ...
Добавлено: 18 сентября 2025 г.
Цифровой театр абсурда: могут ли нейросети поставить новую научную проблему перед психологией? Кейс-сравнение ChatGPT и DeepSeek
Хашутогова У. П., Березнер Т. А., Поддьяков А. Н., Новые психологические исследования 2025 № 3 С. 100–125
Бурное развитие технологий искусственного интеллекта не может оставить в стороне исследователей-психологов. Хотя нейросети начинают использоваться почти во всех сферах человеческой деятельности, остаются неясными границы их применимости, насколько создаваемый ими контент является действительно новым и вместе с тем полезным пользователю. Сторонники нейросетей заявляют о необходимости их тотального внедрения, скептики же подвергают серьезному сомнению почти все компетенции ...
Добавлено: 4 сентября 2025 г.
Cultural Evaluation of LLMs in Russian: Catchphrases and Cultural Types
Громенко Е. С., Калачева Д. С., Клокова К. С. и др., , in: Компьютерная лингвистика и интеллектуальные технологии: по материалам ежегодной международной конференции «Диалог» (2025).: [б.и.], 2025.
Наше исследование посвящено изучению культурной осведомленности больших языковых моделей о со временном русскоязычном социокультурном контексте. Для этого предложена структурированная система, включающая 8 культурных типов (например, Духовный практик, Советский интеллигент) и 5 групп речевых клише. На основе этой системы был разработан набор данных из 400 вопросов различных форматов для оценки фактологического знания культурных особенностей и более ...
Добавлено: 10 мая 2025 г.
ChatGPT, текст, информация: критический анализ
Комашко М. Н., Труды по интеллектуальной собственности 2024 Т. 50 № 3 С. 118–128
В работе рассматриваются вопросы теории и практики, связанные с таким типом искусственного интеллекта, как большие языковые модели, в частности, ChatGPT. Основное внимание уделено сферам человеческой деятельности, в которых обмен информацией, изложенной в виде текста, имеет наибольшее значение: науке, образованию и журналистике (медиасфере). Описывается опыт взаимодействия пользователей с чат-ботами. Достаточно подробно рассматривается принцип работы больших языковых моделей. ...
Добавлено: 29 декабря 2024 г.
Russian Learner Corpus: Towards Error-Cause Annotation for L2 Russian
Косакин Д. Ю., Obiedkov S., Smirnov I. и др., , in: Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024).: ELRA and ICCL, 2024. P. 14240–14258.
Добавлено: 25 октября 2024 г.
Distractor Generation for Lexical Questions Using Learner Corpus Data
Nikita Login, Jazykovedny Casopis 2023 Vol. 74 No. 1 P. 345–356
Добавлено: 16 сентября 2024 г.
Dialogue as Autocommunication - On Interactions with Large Language Models
Kartasheva Anna, Technology and Language 2024 Vol. 5 No. 2 P. 57–66
В диалоге с большими языковыми моделями (LLM) происходит совпадение адресата и адресанта сообщения, поэтому такой диалог можно назвать аутокоммуникацией. Нейросеть может ответить только на вопрос, имеющий формулировку. Формулирует вопрос тот, кто спрашивает — то есть, человек. Активность человека в диалоге с нейросетями провоцирует на размышления о природе такого диалога. Составление промптов является одной из самых творческих частей общения с нейросетями. Но, стоит отметить, что нейросеть зачастую лучше ...
Добавлено: 9 сентября 2024 г.
Truth-O-Meter: Handling Multiple Inconsistent Sources Repairing LLM Hallucinations
Galitsky B., Чернявский А. С., Ильвовский Д. А., , in: SIGIR '24: Proceedings of the 47th International ACM SIGIR Conference on Research and Development in Information Retrieval.: Association for Computing Machinery (ACM), 2024. P. 2817–2821.
Large Language Models (LLM) often produce text with incorrect facts and hallucinations. To address this issue, we developed a fact-checking system Truth-O-Meter which verifies LLM results on the Internet and other sources of information to detect wrong claims/facts and proposes corrections for them. NLP and reasoning techniques such as Abstract Meaning Representation and syntactic alignment are ...
Добавлено: 9 мая 2024 г.
Обработка слов с частотными орфографическими ошибками (исследование на базе учебного корпуса английского языка)
Климова М. А., Виклова А. В., Оверникова Д. А., Вестник Санкт-Петербургского университета. Язык и литература 2023 Т. 20 № 4 С. 824–837
Статья посвящена экспериментальному исследованию влияния частотности орфографических ошибок в слове на качество его репрезентации в ментальном лексиконе. Гипотеза о том, что слова, в которых часто совершаются ошибки правописания, затрудняют восприятие при чтении, даже если написаны правильно, ранее была подтверждена для носителей русского и английского языков. Данная работа нацелена на проверку гипотезы на материале учебного корпуса ...
Добавлено: 26 января 2024 г.
Here We Go Again: Modern GEC Models Need Help with Spelling
Starchenko V., Старченко А. М., Proceedings of the Institute for System Programming of the RAS 2023 Vol. 35 No. 5 P. 215–228
Добавлено: 30 ноября 2023 г.
Устный учебный корпус РКИ: новый источник данных для лингвистических и методических исследований
Власова Е. А., Бец Ю. В., Северина Е. М., В кн.: «Русская грамматика в диалоге научных школ, направлений, методов».: Владивосток: Издательство ДВФУ, 2022.
В статье анализируются нетривиальные фонетические и грамматические явления устной речи иностранцев, изучающих русский язык. Показано, что устный учебный корпус позволяет получить систематическое представление о компенсаторных механизмах речепорождения, проверять и формулировать гипотезы. ...
Добавлено: 8 ноября 2023 г.
Аннотирование учебного корпуса в аспекте его использования для исследовательских задач
Климова М. А., Виклова А. В., Оверникова Д. А., В кн.: Современная лингвистика: от теории к практике. III Казанский международный лингвистический саммит (Казань, 14–19 ноября 2022 г.): Труды и материалы, в трёх томах, том 1.: Каз.: Издательство Казанского университета, 2022. С. 46–50.
В данной статье рассматривается классификация ошибок, используемая в учебном корпусе REALEC, в аспекте ее соответствия требованиям и приспособленности для исследовательских задач. ...
Добавлено: 17 января 2023 г.
Review of Practices of Collecting and Annotating Texts in the Learner Corpus REALEC
Виноградова О. И., Ляшевская О. Н., , in: Text, Speech, and Dialogue. 25th International Conference, TSD 2022, Brno, Czech Republic, September 6–9, 2022, Proceedings Lecture Notes in Computer Science (LNAI), vol. 13502Vol. 13502.: Cham: Springer Publishing Company, 2022. P. 77–88.
Добавлено: 5 октября 2022 г.
ПРИОРИТЕТНОСТЬ ОЦЕНКИ В МЕТОДИКЕ ПОВЫШЕНИЯ КОНКУРЕНТОСПОСОБНОСТИ
Виноградова О. В., Экономика и предпринимательство 2019 № 9 (110) С. 605–608
Разработана система оценки конкурентоспособности дорожной строительной ор ганизации. Упорядочен порядок отбора оцениваемых организаций -конкурентов на региональном рынке дорожного строительства. Экспертным путем определены критерии и показатели оценки, а также соответствующие коэффициенты их значимости. Для улучшения качества оценки, показатели оцен ки уточнены частными показателями. Учитывая относительность понятия конкурентоспособности, введено понятие наилучшей организации. Применен коэффициент сравнимости с показателями ...
Добавлено: 26 октября 2021 г.
Автоматическое обнаружение и исправление деривационных ошибок в письменной речи на русском как иностранном
Выренкова А. С., Смирнов И. Ю., Вестник Новосибирского государственного университета. Серия: Лингвистика и межкультурная коммуникация 2021 Т. 19 № 3 С. 57–68
Учебные корпуса представляют собой один из наиболее ценных источников статистических данных об ошиб-ках учащихся. Например, информация из корпусов учащихся, которые изучают язык как иностранный, ис-пользуется для исследований в области усвоения второго языка [Granger, 1996]. Однако достоверность содер-жащихся в корпусах данных зависит от качества разметки ошибок, которая чаще всего выполняется вручную и, таким образом, представляет собой ...
Добавлено: 24 сентября 2021 г.
  • О ВЫШКЕ
  • Цифры и факты
  • Руководство и структура
  • Устойчивое развитие в НИУ ВШЭ
  • Преподаватели и сотрудники
  • Корпуса и общежития
  • Закупки
  • Обращения граждан в НИУ ВШЭ
  • Фонд целевого капитала
  • Противодействие коррупции
  • Сведения о доходах, расходах, об имуществе и обязательствах имущественного характера
  • Сведения об образовательной организации
  • Людям с ограниченными возможностями здоровья
  • Единая платежная страница
  • Работа в Вышке
  • ОБРАЗОВАНИЕ
  • Лицей
  • Довузовская подготовка
  • Олимпиады
  • Прием в бакалавриат
  • Вышка+
  • Прием в магистратуру
  • Аспирантура
  • Дополнительное образование
  • Центр развития карьеры
  • Бизнес-инкубатор ВШЭ
  • Образовательные партнерства
  • Обратная связь и взаимодействие с получателями услуг
  • НАУКА
  • Научные подразделения
  • Исследовательские проекты
  • Мониторинги
  • Диссертационные советы
  • Защиты диссертаций
  • Академическое развитие
  • Конкурсы и гранты
  • Внешние научно-информационные ресурсы
  • РЕСУРСЫ
  • Библиотека
  • Издательский дом ВШЭ
  • Книжный магазин «БукВышка»
  • Типография
  • Медиацентр
  • Журналы ВШЭ
  • Публикации
  • http://www.minobrnauki.gov.ru/
    Министерство науки и высшего образования РФ
  • https://edu.gov.ru/
    Министерство просвещения РФ
  • http://www.edu.ru
    Федеральный портал «Российское образование»
  • https://elearning.hse.ru/mooc
    Массовые открытые онлайн-курсы
  • НИУ ВШЭ1993–2026
  • Адреса и контакты
  • Условия использования материалов
  • Политика конфиденциальности
  • Правила применения рекомендательных технологий в НИУ ВШЭ
  • Карта сайта
Редактору