• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • A
  • A
  • A
  • A
  • A
Обычная версия сайта
  • RU
  • EN
  • Национальный исследовательский университет «Высшая школа экономики»
  • Публикации ВШЭ
  • Статьи
  • Fighting Evaluation Inflation: Concentrated Datasets for Grammatical Error Correction
  • RU
  • EN
Расширенный поиск
Высшая школа экономики
Национальный исследовательский университет
Приоритетные направления
  • бизнес-информатика
  • государственное и муниципальное управление
  • гуманитарные науки
  • инженерные науки
  • компьютерно-математическое
  • математика
  • менеджмент
  • право
  • социология
  • экономика
по году
  • 2027
  • 2026
  • 2025
  • 2024
  • 2023
  • 2022
  • 2021
  • 2020
  • 2019
  • 2018
  • 2017
  • 2016
  • 2015
  • 2014
  • 2013
  • 2012
  • 2011
  • 2010
  • 2009
  • 2008
  • 2007
  • 2006
  • 2005
  • 2004
  • 2003
  • 2002
  • 2001
  • 2000
  • 1999
  • 1998
  • 1997
  • 1996
  • 1995
  • 1994
  • 1993
  • 1992
  • 1991
  • 1990
  • 1989
  • 1988
  • 1987
  • 1986
  • 1985
  • 1984
  • 1983
  • 1982
  • 1981
  • 1980
  • 1979
  • 1978
  • 1977
  • 1976
  • 1975
  • 1974
  • 1973
  • 1972
  • 1971
  • 1970
  • 1969
  • 1968
  • 1967
  • 1966
  • 1965
  • 1964
  • 1963
  • 1958
  • еще
Тематика
Новости
8 июня 2026 г.
«За 12 лет на нашем счету почти 1000 операций с пробуждением»
В НИУ ВШЭ прошла XIII Летняя нейролингвистическая школа, организованная Центром языка и мозга при поддержке факультета гуманитарных наук НИУ ВШЭ. В центре внимания слушателей была совместная работа нейролингвистов, нейрохирургов и нейрофизиологов в операционной, стандартизация лингвистических парадигм и практические подходы к сохранению речевой функции пациентов.
5 июня 2026 г.
Аспирантка НИУ ВШЭ открыла «невидимую» планировку античного Париона
Исследовательница из НИУ ВШЭ Идиль Малгиль изучила с помощью дрона с лазерным сканером сверхвысокого разрешения древнеримский город Парион, расположенный на территории современной Турции. Благодаря высокой плотности сканирования удалось зафиксировать крошечные неровности рельефа, скрытые под землей и растительностью. Обнаружены следы целых кварталов, террасных систем и стен, которые невозможно было различить ни при обычных раскопках, ни с помощью аэрофотосъемки. Результаты исследованияо публикованы в международном научном журнале Ancient Civilizations from Scythia to Siberia.
2 июня 2026 г.
От Волги до Янцзы: математики из Нижнего Новгорода и Шанхая изучают устойчивость систем
Математики НИУ ВШЭ в Нижнем Новгороде совместно с коллегами из шанхайского Университета Тунцзи исследуют фундаментальные причины структурной устойчивости систем и механизмы их нарушения. О развитии проекта Qualitative Theory of Systems of Ordinary and Partial Differential Equations в рамках программы НИУ ВШЭ «Международное академическое сотрудничество» «Вышке.Главное» рассказала его руководитель, профессор Ольга Починка, заведующая Международной лабораторией динамических систем и приложений НИУ ВШЭ в Нижнем Новгороде.


 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!

Публикации
  • Книги
  • Статьи
  • Главы в книгах
  • Препринты
  • Верификация публикаций
  • Расширенный поиск
  • Правила использования материалов
  • Наука в ВШЭ

?

Fighting Evaluation Inflation: Concentrated Datasets for Grammatical Error Correction

Journal of Language and Education. 2024. Vol. 10. No. 4. P. 112–129.
Vladimir Starchenko, Darya Kharlamova, Elizaveta Klykova, Anastasia Shavrina, Aleksey Starchenko, Olga Vinogradova, Olga Lyashevskaya

Background: Grammatical error correction (GEC) systems have greatly developed over the recent decade. According to common metrics, they often reach the level of or surpass human experts. Nevertheless, they perform poorly on several kinds of errors that are effortlessly corrected by humans. Thus, reaching the resolution limit, evaluation algorithms and datasets do not allow for further enhancement of GEC systems.

Purpose: To solve the problem of the resolution limit in GEC. The suggested approach is to use for evaluation concentrated datasets with a higher density of errors that are difficult for modern GEC systems to handle.

Method: To test the suggested solution, we look at distant-context-sensitive errors that have been acknowledged as challenging for GEC systems. We create a concentrated dataset for English with a higher density of errors of various types, half-manually aggregating pre-annotated examples from four existing datasets and further expanding the annotation of distant-context-sensitive errors. Two GEC systems are evaluated using this dataset, including traditional scoring algorithms and a novel approach modified for longer contexts.

Results: The concentrated dataset includes 1,014 examples sampled manually from FCE, CoNLL-2014, BEA-2019, and REALEC. It is annotated for types of context-sensitive errors such as pronouns, verb tense, punctuation, referential device, and linking device. GEC systems show lower scores when evaluated on the dataset with a higher density of challenging errors, compared to a random dataset with otherwise the same parameters.

Conclusion: The lower scores registered on concentrated datasets confirm that they provide a way for future improvement of GEC models. The dataset can be used for further studies focusing on distant-context-sensitive GEC.

Научное направление: Филология и лингвистика Компьютерные науки
Язык: английский
Полный текст
DOI
Текст на другом сайте
Ключевые слова: ESLавтоматическое исправление ошибок Grammatical Error CorrectionL2 errorsconcentrated datasetscross-sentence GECошибки L2английский как второй языкконцентрированные наборы данныхисправление ошибок в широком контексте
Похожие публикации
TreeDQN: Sample-efficient off-policy reinforcement learning for combinatorial optimization
Sorokin D., Kostin A., Савченко Л. В. и др., Knowledge-Based Systems 2026 Vol. 348 Article 116258
Добавлено: 10 июня 2026 г.
Microbial diversity and production of milk spirit using traditional Buryat fermentation and distillation technologies
Namsaraev Z., Козлова А. Д., Toshchakov S., Scientific Reports 2026 Vol. 16 No. 17769
Дистиллированные кисломолочные напитки встречаются в пищевой промышленности редко, несмотря на повсеместное распространение растительных спиртных напитков. В настоящее время производство крепких дистиллированных алкогольных напитков из кисломолочных продуктов с использованием традиционных технологий известно лишь среди монголоязычных народов и их сибирских соседей. Данное исследование представляет собой первый междисциплинарный анализ дарасуна, традиционного бурятского спиртного напитка, изготавливаемого из кисломолочного напитка ...
Добавлено: 10 июня 2026 г.
«Увидел он гордеца павшим…» Мятеж Амасиса против Априя и египетский поход Навуходоносора II в древней и средневековой традиции
Ладынин И. А., Немировский А. А., Банщикова А. А. и др., М.: Альма матер, 2026.
В коллективной монографии подробно анализируются источники, связанные с предысторией, ходом и последствиями малоизвестного эпизода истории древнего Египта и Ближнего Востока – узурпации власти в Египте военачальником Амасисом у царя XXVI династии Априя (570-567 гг. до н.э.) и вмешательства в их противостояние вавилонского царя Навуходоносора II (567 г. до н.э.). Рассматривается значимость этого эпизода в восприятии ...
Добавлено: 10 июня 2026 г.
Artificial intelligence and digital twins for failure prediction in data center cooling systems: a comprehensive literature review (2018–2026)
Гущин М. И., Butorova A., Bobakov V. и др., European Physical Journal: Special Topics 2026 P. 1–19
Добавлено: 10 июня 2026 г.
Innovations in Information and Decision Sciences. Proceedings of the 13th International Conference on Frontiers in Intelligent Computing: Theory and Applications (FICTA 2025), Volume 4
Springer, 2026.
Добавлено: 8 июня 2026 г.
От «контейнеров для знаний» к «эпистемической амальгамации»: концептуальная метафора в дискурсе междисциплинарности
Нагорная А. В., Бакулев А. В., Человек: образ и сущность. Гуманитарные аспекты 2026 № 2(66) С. 9–36
В статье исследуется роль концептуальной метафоры в осмыслении принципов междисциплинарного взаимодействия и в продвижении междисдиплинарности как модуса научного познания. Определяются функции метафоры в дискурсе междисциплинарности: идеационная, экспланаторная, иллюстративная, прескриптивная и аффективная. На материале статей и монографий по методологии науки, написанных в период с 1961 по 2025 гг., выявляются главенствующие метафоры, с помощью которых осмысляется суть ...
Добавлено: 5 июня 2026 г.
Avant-Garde Poetry and the Tékhnē of Traditional Versification
Казарцев Е. В., Kirichenko N., Arts 2026 Vol. 15 No. 5 Article 97
Добавлено: 4 июня 2026 г.
Rank‑Turbulence Delta and interpretable approaches to stylometric Delta measures
Dmitry Pronin, Evgeny Kazartsev, Digital Scholarship in the Humanities 2026 P. 1–15
Добавлено: 4 июня 2026 г.
Proceedings of the 43rd International Conference on Machine Learning (ICML 2026)
Seul: PMLR, 2026.
Добавлено: 4 июня 2026 г.
Трансфикциональный метаперсонаж Жан-Батист Ботюль
Кириченко В. В., Известия Саратовского университета. Новая серия. Серия: Филология. Журналистика 2026 Т. 26 № 2 С. 200–209
Настоящая работа посвящена фигуре вымышленного философа по имени Жан-Батист Ботюль и его роли в дискурсе современной французской литературы. Для анализа данного героя в работе используются концепции трансфикциональности и метаперсонажа. Сам Ботюль придуман французским журналистом-сатириком Фредериком Пажесом. Его изобретение получило широкую популярность в среде различных деятелей науки и искусства, которые продолжили придумывать исследования и работы, якобы ...
Добавлено: 3 июня 2026 г.
A Language Model for Grammatical Error Correction in L2 Russian
Remnev N., Obiedkov S., Рахилина Е. В. и др., / Series Computer Science "arxiv.org". 2023.
Добавлено: 30 октября 2024 г.
Writing practices of university students in an online academic English course in Uzbekistan
Ахмеджанова Д. Р., Writing and Pedagogy 2022 Vol. 14 No. 1 P. 129–150
Добавлено: 31 октября 2022 г.
Споры в сфере киберспорта: вопросы «forum conveniens», эффективных процедур и обеспечительных мер
Абдуллина В. А., Арбитражный и гражданский процесс (Российская Федерация) 2021 № 11 С. 23–28
Статья посвящена поиску оптимальных институтов и процедуры разрешения споров в сфере киберспорта. Анализируя особенности данной отрасли, автор предполагает, что необходима дифференциация споров по субъектному критерию на споры с профессиональными участниками (ESIC) и с пользователями. По итогам рассмотрения действующих процессуальных механизмов автор приходит к выводу о применимости процедуры установления обеспечительных мер к процессуальным инструментам в киберспортивных ...
Добавлено: 3 июня 2022 г.
Автоматическое обнаружение и исправление деривационных ошибок в письменной речи на русском как иностранном
Выренкова А. С., Смирнов И. Ю., Вестник Новосибирского государственного университета. Серия: Лингвистика и межкультурная коммуникация 2021 Т. 19 № 3 С. 57–68
Учебные корпуса представляют собой один из наиболее ценных источников статистических данных об ошиб-ках учащихся. Например, информация из корпусов учащихся, которые изучают язык как иностранный, ис-пользуется для исследований в области усвоения второго языка [Granger, 1996]. Однако достоверность содер-жащихся в корпусах данных зависит от качества разметки ошибок, которая чаще всего выполняется вручную и, таким образом, представляет собой ...
Добавлено: 24 сентября 2021 г.
Writing for Social Media as an Integral Part of an ESL Course
Бакулев А. В., Bondarev M., Zablotskaya O., , in: 2nd International Multidisciplinary Scientific Conference on Social Sciences and Arts SGEM2015. Conference ProceedingsVol. II. Book 1: Psychology and Psychyatry, Sociology and Helathcare, Education.: Sofia: STEF92 Technology Ltd., 2015. P. 1193–1200.
Добавлено: 13 октября 2016 г.
Mastering English through Global Debate
Талалакина Е. В., Brown N. A., Bown J. и др., Washington: Georgetown University Press, 2014.
Mastering English through Global Debate brings together rhetorical traditions and the best practices of ESL instruction to facilitate Superior-level proficiency in the English language. Each chapter addresses a rich topic of debate, providing students with a set of prereading activities, texts covering both sides of a debate topic, and postreading comprehension and lexical development exercises ...
Добавлено: 27 ноября 2014 г.
Case study: A community of learners
Плахотник М. С., , in: Adult education special topics: Theory, research and practice in lifelong learning: Case studies and activities in adult education and human resource development.: Charlotte: Information Age Publishing, 2010. P. 50–52.
Добавлено: 10 июня 2014 г.
Role plays as an effective approach to teaching cross-cultural communication
Кузнецова М. Н., , in: Language in Culture and Culture in Language: Сборник материалов международной научно-практической конференции, 25-26 сентября 2009 (The First MELTA Conference).: М.: Институт гуманитарного образования и информационных технологий, 2009. P. 53–58.
Добавлено: 28 октября 2012 г.
  • О ВЫШКЕ
  • Цифры и факты
  • Руководство и структура
  • Устойчивое развитие в НИУ ВШЭ
  • Преподаватели и сотрудники
  • Корпуса и общежития
  • Закупки
  • Обращения граждан в НИУ ВШЭ
  • Фонд целевого капитала
  • Противодействие коррупции
  • Сведения о доходах, расходах, об имуществе и обязательствах имущественного характера
  • Сведения об образовательной организации
  • Людям с ограниченными возможностями здоровья
  • Единая платежная страница
  • Работа в Вышке
  • ОБРАЗОВАНИЕ
  • Лицей
  • Довузовская подготовка
  • Олимпиады
  • Прием в бакалавриат
  • Вышка+
  • Прием в магистратуру
  • Аспирантура
  • Дополнительное образование
  • Центр развития карьеры
  • Бизнес-инкубатор ВШЭ
  • Образовательные партнерства
  • Обратная связь и взаимодействие с получателями услуг
  • НАУКА
  • Научные подразделения
  • Исследовательские проекты
  • Мониторинги
  • Диссертационные советы
  • Защиты диссертаций
  • Академическое развитие
  • Конкурсы и гранты
  • Внешние научно-информационные ресурсы
  • РЕСУРСЫ
  • Библиотека
  • Издательский дом ВШЭ
  • Книжный магазин «БукВышка»
  • Типография
  • Медиацентр
  • Журналы ВШЭ
  • Публикации
  • http://www.minobrnauki.gov.ru/
    Министерство науки и высшего образования РФ
  • https://edu.gov.ru/
    Министерство просвещения РФ
  • http://www.edu.ru
    Федеральный портал «Российское образование»
  • https://elearning.hse.ru/mooc
    Массовые открытые онлайн-курсы
  • НИУ ВШЭ1993–2026
  • Адреса и контакты
  • Условия использования материалов
  • Политика конфиденциальности
  • Правила применения рекомендательных технологий в НИУ ВШЭ
  • Карта сайта
Редактору