Correcting or Rewriting? An Expert Evaluation of LLM-Based GEC on Academic Learner Data

?

Correcting or Rewriting? An Expert Evaluation of LLM-Based GEC on Academic Learner Data

Ch. 26. P. 1–10.

Kopylova E.V., Цегоева О. Г., Berlin V.A., Vyrenkova A.S., Кувшинская Ю. М.

Данная статья посвящена исследованию того, как большие языковые модели исправляют сложные
грамматические ошибки в академических учебных текстах на русском языке. В отличие от традиционныхGEC-систем, которые руководствуются принципом минимального исправления, большие языковые модели(LLM) часто применяют генеративные стратегии переписывания, которые могут улучшить восприятие
текста, однако появляется риск гиперкоррекции структуры и семантических изменений. Мы представляем
новый экспертный бенчмарк, основанный на русском учебном корпусе из 3,1 млн слов, и создаем оценочную
систему, аннотированную по типу ошибки и сложности.Мы предлагаем систему оценивания, основанную на экспертных суждениях и сочетающую в себе
количественный анализ, исследование изменения структуры и слепое попарное сравнение. Результаты
выявляют баланс между минимальными исправлениями и генеративным подходом LLM. Это оказывает
прямое влияние на оценивание, так как референсные метрики могут недооценивать структурную
гиперкоррекцию и не учитывать разницу в подходах к исправлению.

Язык: английский

DOI

Текст на другом сайте

Ключевые слова: система оценки учебный корпус Learner Corpus(LC)evaluation framework GEC LLMs LLM Russian academic writing GEC русское академическое письмо

ПУБЛИКАЦИЯ ПОДГОТОВЛЕНА ПО РЕЗУЛЬТАТАМ ПРОЕКТА:

Языковое и когнитивное многообразие в формальных моделях, компьютерных инструментах и образовательных ресурсах (2025)

В книге

Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной международной конференции «Диалог». Выпуск 24.

Issue 24. , M.: Max press, 2026.

Анализ культурных референций в творчестве А. Вознесенского: цифровое исследование имен персоналий

Тюрякова-Матвеева Д. В., Цифровые гуманитарные исследования 2026 № 1 С. 4–26

Статья исследует культурные референции в творчестве Андрея Вознесенского путем анализа упоминаемых им персоналий. Обработано 1678 произведений, включая поэзию, прозу и ранние неопубликованные стихотворения. Методы NER, основанные на инструментах Natasha, spaCy и LLM Grok, позволили изучить частоту упоминания известных лиц и их связь с жанром произведения. Определены ключевые авторы Вознесенского (Пастернак, Пушкин, Маяковский), выявлены особенности жанра ...

Добавлено: 31 мая 2026 г.

Оценка качества использования больших языковых моделей в задачах машинного перевода

Мыльникова А. В., Мыльников Л. А., Научно-техническая информация. Серия 2: Информационные процессы и системы 2026 № 2 С. 24–33

Представлены результаты сравнительной оценки качества машинного перевода, выполненного большими языковыми моделями (LLM): DeepSeek, Grok, Mistral, Qwen, GigaChat, Yandex, на основе перевода выразительных языковых средств (фразеологизмов, омонимов, каламбуров и т.д.) и текстов различных функциональных стилей. Качество перевода оценивалось количественно с помощью метрик когерентности (BLEU, METEOR, chrF) и качественно — путем экспертного анализа на соответствие критериям адекватности, ...

Добавлено: 27 февраля 2026 г.

RuCLEVR: A Russian Diagnostic Dataset for Compositional Language and Elementary Visual Reasoning

Biryukova K., Chelnokova D., Erkenova J. и др., Communications in Computer and Information Science 2024 Vol. 2364 CCIS P. 109 – 121

Добавлено: 25 февраля 2026 г.

Mechanistic Permutability: Match Features Across Layers

Balagansky N., Максимов Я. В., Gavrilov D., , in: Proceedings of the 13th International Conference on Learning Representations (ICLR 2025).: ICLR, 2025. P. 57940–57957.

Добавлено: 25 февраля 2026 г.

Применение больших языковых моделей для анализа ценностно-патриотического дискурса русскоязычных пользователей

Балакина Ю. В., Григорьева М. В., Соколова Е. Н., Вестник Российского фонда фундаментальных исследований. Гуманитарные и общественные науки 2025 Т. 123 № 4 С. 56–69

Статья рассматривает возможности применения больших языковых моделей (LLM) для автоматизированного анализа ценностно-патриотического дискурса русскоязычных пользователей социальных медиа. На материале корпуса сообщений из VK, «Одноклассников» и Telegram (2023–2025 гг.) исследуется, насколько результаты автоматической кодировки совпадают с экспертной разметкой по специально разработанной категориальной схеме. Кодбук включает восемь измерений: базовые ценности по Ш. Шварцу, две оси Р. Инглхарта ...

Добавлено: 26 ноября 2025 г.

Дискурсивные возможности больших языковых моделей при решении задач генерации новых текстов

Мыльникова А. В., Гасимов А. Р., Научно-техническая информация. Серия 2: Информационные процессы и системы 2025 № 9 С. 33–38

На основе изучения функционирования больших языковых моделей (LLMs) и специфических характеристик машинной обработки дискурса показано применение экспериментального метода компьютерного и лингвистического анализа для статистического исследования и интерпретации лингвистических характеристик текстов. В качестве материалов исследования использован лингвистический корпус текстов Brown, а также корпуса искусственно сгенерированных текстов с применением Claude Sonnet 3.7 и Grok-3. В механизмах обработки ...

Добавлено: 19 ноября 2025 г.

Исследования благополучия с помощью передовых методов обработки естественного языка (NLP): перспективы и ограничения

Воеводина Е. Ю., Современная зарубежная психология 2025 Т. 14 № 3 С. 172–181

Контекст и актуальность. Исследования благополучия столкнулись с противоречиями и ограничениями, проистекающими из ограничений метода психометрических самоотчетных шкал. Данные методы критикуются за низкую экологическую валидность, ограниченную информативность и трудности в операционализации комплексного конструкта благополучия. В то же время, стремительное развитие технологий обработки естественного языка (natural language processing, NLP) открывает новые возможности для преодоления этих ограничений. Цель. Провести обзор ...

Добавлено: 9 октября 2025 г.

Языковые модели для предобработки текстов в машинном переводе

Мыльникова А. В., Мыльников Л. А., Научно-техническая информация. Серия 2: Информационные процессы и системы 2025 № 7 С. 32–44

Рассмотрена модель использования скелетных структур на базе синтаксической разметки для предобработки корпусов текстов перед передачей в нейросетевые модели машинного перевода с целью повышения качества их работы, реализованная с помощью частеречной и синтаксической разметок корпусов текстов, использующих языковую модель, с использованием сети BERT и набора правил. Описана подготовка данных для обучения и предложены способы повышения эффективности ...

Добавлено: 22 сентября 2025 г.

Оценка моделей LLM по степени готовности решать задачи управления в области ESG

Сторчевой М. А., Мыльников Л. А., Чернышев В. В. и др., / SSRN. Серия "Working Papers". 2025.

Внимание к охране природы принимает все большую значимость для бизнеса с одной стороны в связи с ужесточением в природоохранном законодательстве, а с другой в связи с использованием ESG рейтингов при принятии решений о коммерческой деятельности компаний. Составление рейтинга LLM систем, способных оказывать консультационные услуги в области природоохраны и ESG, позволяет осуществить выбор такой системы для ...

Добавлено: 18 сентября 2025 г.

Цифровой театр абсурда: могут ли нейросети поставить новую научную проблему перед психологией? Кейс-сравнение ChatGPT и DeepSeek

Хашутогова У. П., Березнер Т. А., Поддьяков А. Н., Новые психологические исследования 2025 № 3 С. 100–125

Бурное развитие технологий искусственного интеллекта не может оставить в стороне исследователей-психологов. Хотя нейросети начинают использоваться почти во всех сферах человеческой деятельности, остаются неясными границы их применимости, насколько создаваемый ими контент является действительно новым и вместе с тем полезным пользователю. Сторонники нейросетей заявляют о необходимости их тотального внедрения, скептики же подвергают серьезному сомнению почти все компетенции ...

Добавлено: 4 сентября 2025 г.

Cultural Evaluation of LLMs in Russian: Catchphrases and Cultural Types

Громенко Е. С., Калачева Д. С., Клокова К. С. и др., , in: Компьютерная лингвистика и интеллектуальные технологии: по материалам ежегодной международной конференции «Диалог» (2025).: [б.и.], 2025.

Наше исследование посвящено изучению культурной осведомленности больших языковых моделей о со временном русскоязычном социокультурном контексте. Для этого предложена структурированная система, включающая 8 культурных типов (например, Духовный практик, Советский интеллигент) и 5 групп речевых клише. На основе этой системы был разработан набор данных из 400 вопросов различных форматов для оценки фактологического знания культурных особенностей и более ...

Добавлено: 10 мая 2025 г.

ChatGPT, текст, информация: критический анализ

Комашко М. Н., Труды по интеллектуальной собственности 2024 Т. 50 № 3 С. 118–128

В работе рассматриваются вопросы теории и практики, связанные с таким типом искусственного интеллекта, как большие языковые модели, в частности, ChatGPT. Основное внимание уделено сферам человеческой деятельности, в которых обмен информацией, изложенной в виде текста, имеет наибольшее значение: науке, образованию и журналистике (медиасфере). Описывается опыт взаимодействия пользователей с чат-ботами. Достаточно подробно рассматривается принцип работы больших языковых моделей. ...

Добавлено: 29 декабря 2024 г.

Russian Learner Corpus: Towards Error-Cause Annotation for L2 Russian

Косакин Д. Ю., Obiedkov S., Smirnov I. и др., , in: Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024).: ELRA and ICCL, 2024. P. 14240–14258.

Добавлено: 25 октября 2024 г.

Distractor Generation for Lexical Questions Using Learner Corpus Data

Nikita Login, Jazykovedny Casopis 2023 Vol. 74 No. 1 P. 345–356

Добавлено: 16 сентября 2024 г.

Dialogue as Autocommunication - On Interactions with Large Language Models

Kartasheva Anna, Technology and Language 2024 Vol. 5 No. 2 P. 57–66

В диалоге с большими языковыми моделями (LLM) происходит совпадение адресата и адресанта сообщения, поэтому такой диалог можно назвать аутокоммуникацией. Нейросеть может ответить только на вопрос, имеющий формулировку. Формулирует вопрос тот, кто спрашивает — то есть, человек. Активность человека в диалоге с нейросетями провоцирует на размышления о природе такого диалога. Составление промптов является одной из самых творческих частей общения с нейросетями. Но, стоит отметить, что нейросеть зачастую лучше ...

Добавлено: 9 сентября 2024 г.

Truth-O-Meter: Handling Multiple Inconsistent Sources Repairing LLM Hallucinations

Galitsky B., Чернявский А. С., Ильвовский Д. А., , in: SIGIR '24: Proceedings of the 47th International ACM SIGIR Conference on Research and Development in Information Retrieval.: Association for Computing Machinery (ACM), 2024. P. 2817–2821.

Large Language Models (LLM) often produce text with incorrect facts and hallucinations. To address this issue, we developed a fact-checking system Truth-O-Meter which verifies LLM results on the Internet and other sources of information to detect wrong claims/facts and proposes corrections for them. NLP and reasoning techniques such as Abstract Meaning Representation and syntactic alignment are ...

Добавлено: 9 мая 2024 г.

Обработка слов с частотными орфографическими ошибками (исследование на базе учебного корпуса английского языка)

Климова М. А., Виклова А. В., Оверникова Д. А., Вестник Санкт-Петербургского университета. Язык и литература 2023 Т. 20 № 4 С. 824–837

Статья посвящена экспериментальному исследованию влияния частотности орфографических ошибок в слове на качество его репрезентации в ментальном лексиконе. Гипотеза о том, что слова, в которых часто совершаются ошибки правописания, затрудняют восприятие при чтении, даже если написаны правильно, ранее была подтверждена для носителей русского и английского языков. Данная работа нацелена на проверку гипотезы на материале учебного корпуса ...

Добавлено: 26 января 2024 г.

Here We Go Again: Modern GEC Models Need Help with Spelling

Starchenko V., Старченко А. М., Proceedings of the Institute for System Programming of the RAS 2023 Vol. 35 No. 5 P. 215–228

Добавлено: 30 ноября 2023 г.

Устный учебный корпус РКИ: новый источник данных для лингвистических и методических исследований

Власова Е. А., Бец Ю. В., Северина Е. М., В кн.: «Русская грамматика в диалоге научных школ, направлений, методов».: Владивосток: Издательство ДВФУ, 2022.

В статье анализируются нетривиальные фонетические и грамматические явления устной речи иностранцев, изучающих русский язык. Показано, что устный учебный корпус позволяет получить систематическое представление о компенсаторных механизмах речепорождения, проверять и формулировать гипотезы. ...

Добавлено: 8 ноября 2023 г.

Аннотирование учебного корпуса в аспекте его использования для исследовательских задач

Климова М. А., Виклова А. В., Оверникова Д. А., В кн.: Современная лингвистика: от теории к практике. III Казанский международный лингвистический саммит (Казань, 14–19 ноября 2022 г.): Труды и материалы, в трёх томах, том 1.: Каз.: Издательство Казанского университета, 2022. С. 46–50.

В данной статье рассматривается классификация ошибок, используемая в учебном корпусе REALEC, в аспекте ее соответствия требованиям и приспособленности для исследовательских задач. ...

Добавлено: 17 января 2023 г.

Review of Practices of Collecting and Annotating Texts in the Learner Corpus REALEC

Виноградова О. И., Ляшевская О. Н., , in: Text, Speech, and Dialogue. 25th International Conference, TSD 2022, Brno, Czech Republic, September 6–9, 2022, Proceedings Lecture Notes in Computer Science (LNAI), vol. 13502Vol. 13502.: Cham: Springer Publishing Company, 2022. P. 77–88.

Добавлено: 5 октября 2022 г.

ПРИОРИТЕТНОСТЬ ОЦЕНКИ В МЕТОДИКЕ ПОВЫШЕНИЯ КОНКУРЕНТОСПОСОБНОСТИ

Виноградова О. В., Экономика и предпринимательство 2019 № 9 (110) С. 605–608

Разработана система оценки конкурентоспособности дорожной строительной ор ганизации. Упорядочен порядок отбора оцениваемых организаций -конкурентов на региональном рынке дорожного строительства. Экспертным путем определены критерии и показатели оценки, а также соответствующие коэффициенты их значимости. Для улучшения качества оценки, показатели оцен ки уточнены частными показателями. Учитывая относительность понятия конкурентоспособности, введено понятие наилучшей организации. Применен коэффициент сравнимости с показателями ...

Добавлено: 26 октября 2021 г.

Автоматическое обнаружение и исправление деривационных ошибок в письменной речи на русском как иностранном

Выренкова А. С., Смирнов И. Ю., Вестник Новосибирского государственного университета. Серия: Лингвистика и межкультурная коммуникация 2021 Т. 19 № 3 С. 57–68

Учебные корпуса представляют собой один из наиболее ценных источников статистических данных об ошиб-ках учащихся. Например, информация из корпусов учащихся, которые изучают язык как иностранный, ис-пользуется для исследований в области усвоения второго языка [Granger, 1996]. Однако достоверность содер-жащихся в корпусах данных зависит от качества разметки ошибок, которая чаще всего выполняется вручную и, таким образом, представляет собой ...

Добавлено: 24 сентября 2021 г.