• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • A
  • A
  • A
  • A
  • A
Обычная версия сайта
  • RU
  • EN
  • Национальный исследовательский университет «Высшая школа экономики»
  • Публикации ВШЭ
  • Статьи
  • Fighting Evaluation Inflation: Concentrated Datasets for Grammatical Error Correction
  • RU
  • EN
Расширенный поиск
Высшая школа экономики
Национальный исследовательский университет
Приоритетные направления
  • бизнес-информатика
  • государственное и муниципальное управление
  • гуманитарные науки
  • инженерные науки
  • компьютерно-математическое
  • математика
  • менеджмент
  • право
  • социология
  • экономика
по году
  • 2027
  • 2026
  • 2025
  • 2024
  • 2023
  • 2022
  • 2021
  • 2020
  • 2019
  • 2018
  • 2017
  • 2016
  • 2015
  • 2014
  • 2013
  • 2012
  • 2011
  • 2010
  • 2009
  • 2008
  • 2007
  • 2006
  • 2005
  • 2004
  • 2003
  • 2002
  • 2001
  • 2000
  • 1999
  • 1998
  • 1997
  • 1996
  • 1995
  • 1994
  • 1993
  • 1992
  • 1991
  • 1990
  • 1989
  • 1988
  • 1987
  • 1986
  • 1985
  • 1984
  • 1983
  • 1982
  • 1981
  • 1980
  • 1979
  • 1978
  • 1977
  • 1976
  • 1975
  • 1974
  • 1973
  • 1972
  • 1971
  • 1970
  • 1969
  • 1968
  • 1967
  • 1966
  • 1965
  • 1964
  • 1963
  • 1958
  • еще
Тематика
Новости
3 июля 2026 г.
Исследование НИУ ВШЭ: молодые россияне едут в крупные города за высшим образованием
За период с 2011 по 2021 год число переездов 18-летних россиян составило 1,2 млн человек. Из них 78% отправились в 160 крупных городов, что с большой долей вероятности связано с желанием получить высшее образование. Лидеры по формированию вузовских зон притяжения: Москва, Санкт-Петербург, Екатеринбург, Ростов-на-Дону, Краснодар, Новосибирск.
2 июля 2026 г.
Ученые НИУ ВШЭ в Санкт-Петербурге создали микролазер размером с бактерию
Международная команда исследователей при участии НИУ ВШЭ в Санкт-Петербурге создала микролазеры, излучающие в диапазоне глубокого ультрафиолета — 255 нанометров. Устройства работают при комнатной температуре, а диаметр самого маленького из них — около двух микрометров, что сопоставимо с размером бактерии. Такие лазеры могут применяться для сенсоров, спектроскопических систем, фотонных чипов и устройств связи. Работа опубликована в журнале Optics & Laser Technology.
1 июля 2026 г.
Ученые НИУ ВШЭ выяснили, кто и почему в России питается вне дома
Около трети населения (31,3%) практически не едят вне дома и не покупают готовую еду. Ядро активных потребителей — тех, кто питается вне дома или покупает готовое почти ежедневно или несколько раз в неделю, — составляет всего около 9%. Таковы результаты исследования, проведенного Институтом социальной политики НИУ ВШЭ. Как отмечают авторы, питание вне дома в России перестало быть маркером высокого статуса.

 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!

Публикации
  • Книги
  • Статьи
  • Главы в книгах
  • Препринты
  • Верификация публикаций
  • Расширенный поиск
  • Правила использования материалов
  • Наука в ВШЭ

?

Fighting Evaluation Inflation: Concentrated Datasets for Grammatical Error Correction

Journal of Language and Education. 2024. Vol. 10. No. 4. P. 112–129.
Vladimir Starchenko, Darya Kharlamova, Elizaveta Klykova, Anastasia Shavrina, Aleksey Starchenko, Olga Vinogradova, Olga Lyashevskaya

Background: Grammatical error correction (GEC) systems have greatly developed over the recent decade. According to common metrics, they often reach the level of or surpass human experts. Nevertheless, they perform poorly on several kinds of errors that are effortlessly corrected by humans. Thus, reaching the resolution limit, evaluation algorithms and datasets do not allow for further enhancement of GEC systems.

Purpose: To solve the problem of the resolution limit in GEC. The suggested approach is to use for evaluation concentrated datasets with a higher density of errors that are difficult for modern GEC systems to handle.

Method: To test the suggested solution, we look at distant-context-sensitive errors that have been acknowledged as challenging for GEC systems. We create a concentrated dataset for English with a higher density of errors of various types, half-manually aggregating pre-annotated examples from four existing datasets and further expanding the annotation of distant-context-sensitive errors. Two GEC systems are evaluated using this dataset, including traditional scoring algorithms and a novel approach modified for longer contexts.

Results: The concentrated dataset includes 1,014 examples sampled manually from FCE, CoNLL-2014, BEA-2019, and REALEC. It is annotated for types of context-sensitive errors such as pronouns, verb tense, punctuation, referential device, and linking device. GEC systems show lower scores when evaluated on the dataset with a higher density of challenging errors, compared to a random dataset with otherwise the same parameters.

Conclusion: The lower scores registered on concentrated datasets confirm that they provide a way for future improvement of GEC models. The dataset can be used for further studies focusing on distant-context-sensitive GEC.

Научное направление: Филология и лингвистика Компьютерные науки
Язык: английский
Полный текст
DOI
Текст на другом сайте
Ключевые слова: ESLавтоматическое исправление ошибок Grammatical Error CorrectionL2 errorsconcentrated datasetscross-sentence GECошибки L2английский как второй языкконцентрированные наборы данныхисправление ошибок в широком контексте
Похожие публикации
Деепричастия в русском языке XVIIв.: переходный период в истории формирования их грамматического значения
Ермолова М. В., Russian Linguistics 2026 Т. 50 Статья 14
В статье анализируется функционирование деепричастий в русском языке XVII в. На основе анализа контекстов, отсутствующих в современном русском языке, делаются выводы о том, что в XVII в. деепричастие теряло абсолютное временное значение, ко торое имело некогда, приобретая относительное значение в зависимости от времени главного сказуемого, но оставалось при этом предикатом еще формальнонезависимой клаузы. Закрепление за ...
Добавлено: 4 июля 2026 г.
Журнал Телекоммуникации №1 за 2026
М.: Наука и технологии, 2026.
«Телекоммуникации» ежемесячный рецензируемый производственный, информационно-аналитический и учебно-методический журнал выходит в свет с июля 2000 г. Для руководителей и работников промышленности, научно-исследовательских и проектно-конструкторских институтов, высших учебных заведений, аспирантов и студентов, а также для специалистов, разрабатывающих, выпускающих и эксплуатирующих средства телекоммуникаций. Новости разработок и производства, прогнозы развития, защита информации, Нормативные, справочные, аналитические и учебно-методические материалы. Переход к глобальному информационному ...
Добавлено: 4 июля 2026 г.
"Труды МФТИ" Том 17, № 4 (68) (2025)
МФТИ, 2025.
абота  редакции  научного журнала «Труды Московского физико-технического института» (кратко «Труды МФТИ»), редакционной коллегии и редакционного совета осуществляется в соответствии с Положением, утвержденным ректором института. В состав редакционной коллегии входят руководители института, факультетов, институтских и факультетских кафедр. Главный редактор журнала —президент МФТИ, член-корр. РАН Кудрявцев Н.Н.   Журнал «Труды МФТИ» входит в базу данных РИНЦ (Российский Индекс Научного Цитирования) и доступен в электронной ...
Добавлено: 4 июля 2026 г.
Семантика необратимости в медиадискурсе ФРГ: эсхатологические коды и реакция аудитории в условиях кризиса
Москвина Ж. О., Вестник Российского университета дружбы народов. Серия: Литературоведение, журналистика 2026 Т. 31 № 2 С. 398–408
Исследованы семантические и когнитивные механизмы функционирования лексемы «необратимость» (Unumkehrbarkeit), изучен современный немецкий медиа-дискурс, где освещается кризис германо-российских отношений. В основе исследования лежит гипотеза о том, что апелляция к семантике необратимости в СМИ служит ритори-ческой стратегией, призванной усилить восприятие происходящих изменений как окон-чательных. Однако, как демонстрирует проведенный анализ, данная стратегия вступает в противоречие с глубинными структурами ...
Добавлено: 3 июля 2026 г.
Modulation Recognition for Industrial Internet of Things Communication Signals Under Few-Shot Conditions Based on Attention Mechanism and Relation Network
Hualin M., Jie Z., Jerome Y. и др., Journal of Internet Technology 2026 Vol. 27 No. 3 P. 367–382
Добавлено: 3 июля 2026 г.
Кодовые конструкции на базе обобщенных каскадных кодов для систем связи, использующих прием на основе порядковых статистик
Осипов Д. С., Информационно-управляющие системы 2026 № 3 С. 49–62
Введение: во многих проектируемых в настоящее время и перспективных системах связи методы оценивания характеристик канала и управления мощностью сигнала, разработанные для систем связи предыдущих поколений, не могут обеспечить требуемую точность оценивания и выравнивания мощности сигналов на приемном конце. Одним из вариантов решения этой проблемы является использование методов приема на основе порядковых статистик, которые не требуют управления мощностью ...
Добавлено: 3 июля 2026 г.
Men and women are from the same planet Gender similarities in perspective-taking abilities
Imbault C., Слюсарь Н. А., Иваненко А. А. и др., The Mental Lexicon 2026 P. 1–23
Добавлено: 2 июля 2026 г.
Об одном из путей грамматикализации страдательных причастий прошедшего времени в славянских языках (на материале польского и русского языков)
Ермолова М. В., Вопросы языкознания 2026 № 4 С. 73–85
В статье сопоставляются процессы эволюции страдательного причастия прошедшего времени (СППВ) в неопределенно-личную финитную форму прошедшего времени в польском и старорусском языках. Рассматриваются типы контекстов СППВ, зафиксированные в истории русского языка, и типы польских употреблений с СППВ, которые связаны с формированием неопределенно-личной формы на -no/-to. В результате анализа материала обоих языков можно сделать вывод о том, ...
Добавлено: 2 июля 2026 г.
ПИНДАР. ПИФИЙСКАЯ ОДА 9.33–43: О ЧЕМ ГОВОРИТ ХИРОН?
Ахунова О. Л., Индоевропейское языкознание и классическая филология 2026 Т. 30 № 1 С. 108–119
В Девятой Пифийской оде Пиндара есть сцена, которая привлекает особое внимание комменататоров и исследователей не только потому, что любовно-эротическая тема в целом для Пиндара нехарактерна, но и потому, что в этой сцене ни вопрос, с которым Аполлон обращается к Хирону, ни ответ, который дает ему Хирон, не поддаются однозначному толкованию. Намеревается ли Аполлон совершить открытое насилие над ...
Добавлено: 1 июля 2026 г.
Concepts of searching and finding: principles of colexification in a typological perspective
Резникова Т. И., Рахилина Е. В., Рыжова Д. А. и др., Lingua 2026 Vol. 341
Добавлено: 1 июля 2026 г.
Language policy in multiethnic countries: Current trends
Бергельсон М. Б., Grenoble L., Russian Journal of Linguistics 2026 Vol. 30 No. 2 P. 275–309
Добавлено: 30 июня 2026 г.
LANGUAGE POLICY IN MULTIETHNIC COUNTRIES
-, 2026.
Добавлено: 30 июня 2026 г.
ПРОДАННЫЙ ПРАЗДНИК, УКРАДЕННАЯ ЧАСОВНЯ, ПРОИГРАННЫЙ ПРИХОД: ДЕРЕВЕНСКИЙ ПРАЗДНИК КАК СИМВОЛИЧЕСКИЙ КАПИТАЛ
Мороз А. Б., Антропологический форум 2026 Т. 69 С. 296–324
В разных российских регионах время от времени фиксируются не вполне обычные нарративы о том, как одна деревня продала другой свой праздник, как жители одной деревни украли в другой и перевезли к себе часовню, как сельский священник проиграл в карты часть своего прихода священнику соседней деревни. Все эти сюжеты излагаются обычно как курьезный случай, произошедший когда-то ...
Добавлено: 30 июня 2026 г.
VIII Международный научный конгресс (7–8 апреля 2023 г.) / Филология. Социальная и национальная вариативность языка и литературы : материалы VIII Международного научного конгресса Симферополь, Издательский дом КФУ им. В. И. Вернадского, 2023. ISBN: 978-5-605-02308-1
Издательский дом КФУ им. В. И. Вернадского, 2023.
В сборнике представлены статьи по докладам участников VIII Международного научного конгресса «Филология. Социальная и национальная вариативность языка и литературы», который проходил в г. Симферополь 7 – 8 апреля 2023 г. В представленных публикациях рассматриваются актуальные проблемы социолингвистики, социофонетики и фоностилистики, индоевропеистики, литературоведения, языкознания и корпусной лингвистики, коммуникативистики и прагмалингвистики, лингводидактики, библиотечного обслуживания, диалога культур и ...
Добавлено: 30 июня 2026 г.
I Международная научно-образовательная конференция «Пейсиковские чтения: проблемы современного академического востоковедения»: материалы конференции
М.: ИСАА МГУ имени М.В. Ломоносова, 2023.
Издание представляет собой сборник материалов I Международной научно-образовательной конференция «Пейсиковские чтения: проблемы современного академического востоковедения», проведённой 21 апреля 2023 года в ИСАА МГУ имени М.В. Ломоносова. В книге представлены работы сотрудников Института и приглашённых специалистов из ряда ведущих институтов России и зарубежных стран Сборник в электронном виде можно скачать по ссылке http://iranistika.iling-ran.ru/Sbornik/ ...
Добавлено: 30 июня 2026 г.
Великие империи Древнего Ирана: новый аутентичный мультимедийный учебный комплекс
Громова А. В., Научный вестник Крыма (Россия, ISSN: 2499-9911) 2021 № 2 (31) С. 1–13
Запущенный в Иране в 2020 г. проект ‘Телешкола’ опирается на опубликованные Министерством образования и воспитания школьные учебники и во многом отражает стандартное видение иранцами собственной истории и их стремление к продвижению богатейшего культурного наследия страны. Данная статья посвящена лингводидактическому потенциалу материалов «Телешколы» в контексте подготовки нового цифрового УМК по персидскому языку, который объединяет работу с ...
Добавлено: 30 июня 2026 г.
Традиции Ноуруза в Даване, Иран: праздничные сладости и весенние стихи
Громова А. В., Армянский гуманитарный вестник 2022 № 8 С. 267–275
Статья посвящена празднованию иранского нового года в Даване, старинном селении в остане Фарс, Иран, известном своим уникальным рельефом и архаичным диалектом. Часть существующих здесь традиций можно отнести к общеиранским сезонным практикам, однако отдельные кулинарные практики и сладости распространены только в Даване. До настоящего времени в этом месте продолжают слагать календарные стихи на местном диалекте давани. ...
Добавлено: 30 июня 2026 г.
Становление имени: ранние этапы усвоения детьми именной морфологии русского языка.
Воейкова М. Д., Языки славянских культур, 2015.
Книга посвящена описанию начального этапа усвоения русскими детьми имен существительных, прилагательных и числительных. Именная система является основой языковой системы ребенка: известно, что имена лиц и названия предметов составляют около 90% из первых 100 слов детей, овладевающих индоевропейскими языками. Кстати, в языках другого строя (например, в корейском или в китайском) процент имен в начальном словаре может ...
Добавлено: 30 июня 2026 г.
Литературный круг Михаила Кузмина: границы – уровни – прагматика
Пахомова А. С., Quaestio Rossica 2026 Т. 14 № 2 С. 389–405
Рассмотрены структурные и прагматические особенности литературного круга – способа писательской кооперации, который ранее редко становился предметом самостоятельного анализа, особенно в сравнении с иными способами объединения писателей (кружок, салон, группа и т. д.). Основной комплекс проблем, связанных с литературным кругом, заключается в подвижности его границ, отсутствии как эксплицированного способа объединения его членов, так и явленой творческой ...
Добавлено: 30 июня 2026 г.
Иран и его соседи
Громова А. В., М.: КноРус, 2023.
Учебное пособие по лингвострановедению предназначено для востоковедов, изучающих персидский язык в рамках различных специализаций: регионоведение, филология, история и политология, экономическое развитие стран Ближнего и Среднего Востока. Пособие знакомит с реалиями современной иранской жизни и национальными новостными ресурсами, широко использует материалы Интернета. Книга оставляет известную свободу в выборе материала для занятий в зависимости от уровня владения ...
Добавлено: 29 июня 2026 г.
A Language Model for Grammatical Error Correction in L2 Russian
Remnev N., Obiedkov S., Рахилина Е. В. и др., / Series Computer Science "arxiv.org". 2023.
Добавлено: 30 октября 2024 г.
Writing practices of university students in an online academic English course in Uzbekistan
Ахмеджанова Д. Р., Writing and Pedagogy 2022 Vol. 14 No. 1 P. 129–150
Добавлено: 31 октября 2022 г.
Споры в сфере киберспорта: вопросы «forum conveniens», эффективных процедур и обеспечительных мер
Абдуллина В. А., Арбитражный и гражданский процесс (Российская Федерация) 2021 № 11 С. 23–28
Статья посвящена поиску оптимальных институтов и процедуры разрешения споров в сфере киберспорта. Анализируя особенности данной отрасли, автор предполагает, что необходима дифференциация споров по субъектному критерию на споры с профессиональными участниками (ESIC) и с пользователями. По итогам рассмотрения действующих процессуальных механизмов автор приходит к выводу о применимости процедуры установления обеспечительных мер к процессуальным инструментам в киберспортивных ...
Добавлено: 3 июня 2022 г.
Автоматическое обнаружение и исправление деривационных ошибок в письменной речи на русском как иностранном
Выренкова А. С., Смирнов И. Ю., Вестник Новосибирского государственного университета. Серия: Лингвистика и межкультурная коммуникация 2021 Т. 19 № 3 С. 57–68
Учебные корпуса представляют собой один из наиболее ценных источников статистических данных об ошиб-ках учащихся. Например, информация из корпусов учащихся, которые изучают язык как иностранный, ис-пользуется для исследований в области усвоения второго языка [Granger, 1996]. Однако достоверность содер-жащихся в корпусах данных зависит от качества разметки ошибок, которая чаще всего выполняется вручную и, таким образом, представляет собой ...
Добавлено: 24 сентября 2021 г.
  • О ВЫШКЕ
  • Цифры и факты
  • Руководство и структура
  • Устойчивое развитие в НИУ ВШЭ
  • Преподаватели и сотрудники
  • Корпуса и общежития
  • Закупки
  • Обращения граждан в НИУ ВШЭ
  • Фонд целевого капитала
  • Противодействие коррупции
  • Сведения о доходах, расходах, об имуществе и обязательствах имущественного характера
  • Сведения об образовательной организации
  • Людям с ограниченными возможностями здоровья
  • Единая платежная страница
  • Работа в Вышке
  • ОБРАЗОВАНИЕ
  • Лицей
  • Довузовская подготовка
  • Олимпиады
  • Прием в бакалавриат
  • Вышка+
  • Прием в магистратуру
  • Аспирантура
  • Дополнительное образование
  • Центр развития карьеры
  • Бизнес-инкубатор ВШЭ
  • Образовательные партнерства
  • Обратная связь и взаимодействие с получателями услуг
  • НАУКА
  • Научные подразделения
  • Исследовательские проекты
  • Мониторинги
  • Диссертационные советы
  • Защиты диссертаций
  • Академическое развитие
  • Конкурсы и гранты
  • Внешние научно-информационные ресурсы
  • РЕСУРСЫ
  • Библиотека
  • Издательский дом ВШЭ
  • Книжный магазин «БукВышка»
  • Типография
  • Медиацентр
  • Журналы ВШЭ
  • Публикации
  • http://www.minobrnauki.gov.ru/
    Министерство науки и высшего образования РФ
  • https://edu.gov.ru/
    Министерство просвещения РФ
  • http://www.edu.ru
    Федеральный портал «Российское образование»
  • https://elearning.hse.ru/mooc
    Массовые открытые онлайн-курсы
  • НИУ ВШЭ1993–2026
  • Адреса и контакты
  • Условия использования материалов
  • Политика конфиденциальности
  • Правила применения рекомендательных технологий в НИУ ВШЭ
  • Карта сайта
Редактору