• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • A
  • A
  • A
  • A
  • A
Обычная версия сайта
  • RU
  • EN
  • Национальный исследовательский университет «Высшая школа экономики»
  • Публикации ВШЭ
  • Статьи
  • Дискриминативная лемматизация сокращений в эпоху LLM
  • RU
  • EN
Расширенный поиск
Высшая школа экономики
Национальный исследовательский университет
Приоритетные направления
  • бизнес-информатика
  • государственное и муниципальное управление
  • гуманитарные науки
  • инженерные науки
  • компьютерно-математическое
  • математика
  • менеджмент
  • право
  • социология
  • экономика
по году
  • 2027
  • 2026
  • 2025
  • 2024
  • 2023
  • 2022
  • 2021
  • 2020
  • 2019
  • 2018
  • 2017
  • 2016
  • 2015
  • 2014
  • 2013
  • 2012
  • 2011
  • 2010
  • 2009
  • 2008
  • 2007
  • 2006
  • 2005
  • 2004
  • 2003
  • 2002
  • 2001
  • 2000
  • 1999
  • 1998
  • 1997
  • 1996
  • 1995
  • 1994
  • 1993
  • 1992
  • 1991
  • 1990
  • 1989
  • 1988
  • 1987
  • 1986
  • 1985
  • 1984
  • 1983
  • 1982
  • 1981
  • 1980
  • 1979
  • 1978
  • 1977
  • 1976
  • 1975
  • 1974
  • 1973
  • 1972
  • 1971
  • 1970
  • 1969
  • 1968
  • 1967
  • 1966
  • 1965
  • 1964
  • 1963
  • 1958
  • еще
Тематика
Новости
17 июня 2026 г.
Биоинформатики НИУ ВШЭ обнаружили 20 опасных мутаций в гене, связанном с легочной артериальной гипертензией
Ученые НИУ ВШЭ совместно с коллегами из российских университетов выяснили, какие мутации в гене ACVRL1 опасны для пациентов с легочной артериальной гипертензией. Они смоделировали, как изменения в гене влияют на связывание АТФ с белком — процесс, от которого зависит передача сигналов, необходимых для работы сосудов. Оказалось, что 20 из 32 вариантов могут нарушать передачу сигнала и провоцировать болезнь. Результаты опубликованы в Journal of Structural Biology.
17 июня 2026 г.
Интеллектуальная робототехника: кадровый голод и масса возможностей
Пока на рынке мало кадров, способных заниматься разработкой интеллектуальных робототехнических систем. Между тем именно к этому идет робототехника. Как учат ее проектированию и каково будущее отрасли, в интервью IQ Media рассказал заведующий Проектно-учебной лабораторией робототехники НИУ ВШЭ Вадим Моргачев.
17 июня 2026 г.
Каким должно быть образование, чтобы готовить кадры для экономики будущего
Эти вопросы обсудят на форуме HR EXPO PRO ЛЮДЕЙ, который состоится 18-19 июня в Москве. В его работе примет участие ректор НИУ ВШЭ Никита Анисимов, федеральные министры, HR-директора компаний, ректоры вузов, эксперты. На форуме будет представлен стенд, посвященный программам ДПО НИУ ВШЭ.

 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!

Публикации
  • Книги
  • Статьи
  • Главы в книгах
  • Препринты
  • Верификация публикаций
  • Расширенный поиск
  • Правила использования материалов
  • Наука в ВШЭ

?

Дискриминативная лемматизация сокращений в эпоху LLM

Доклады Российской академии наук. Математика, информатика, процессы управления (ранее - Доклады Академии Наук. Математика). 2025. Т. 527. С. 146–155.
Глазкова А. В., Смаль И. В., Ляшевская О. Н., Морозов Д. А.

В работе представлено исследование эффективности дискриминативных методов лемматизации сокращений в русскоязычных текстах. В отличие от генеративных подходов, дискриминативные модели осуществляют выбор оптимальной леммы из фиксированного набора вариантов, что исключает риск генерации грамматически некорректных словоформ. Впервые для русского языка проводится комплексный анализ четырех контекстно-ориентированных подходов: (1) ранжирования на основе маскированного языкового моделирования, (2) бинарной классификации, (3) многоклассовой классификации, а также (4) обучения с использованием инструкций. Особое внимание уделено случаям контекстной неоднозначности, когда одно сокращение в пределах одного текстового фрагмента соответствует разным лемам. Результаты демонстрируют, что многоклассовая классификация с дообучением предобученных моделей достигает наивысшего качества (F-мера с макроусреднением – 97.75–99.92% в зависимости от сокращения); однако в условиях ограниченного объема обучающих данных обучение с использованием инструкций и ранжирование на основе маскированного языкового моделирования показывают перспективные результаты. Кроме того, эффективность данных подходов возрастает в случаях контекстной неоднозначности. Исследование вносит вклад в развитие методов обработки русскоязычных текстов, предлагая практические рекомендации по выбору архитектур для задач лемматизации сокращений.

Научное направление: Филология и лингвистика Компьютерные науки
Язык: русский
Полный текст
DOI
Текст на другом сайте
Ключевые слова: русский языкRussian languageавтоматическая обработка естественного языкалемматизациясокращенияклассификация текстовtext classificationabbreviationslemmatization natural language processingdiscriminative methodsдискриминативные методы
Похожие публикации
Supervised Learning in Critical Phenomena—Statistical and Systematic Accuracy
Chertenkov V. I., Щур Л. Н., Lobachevskii Journal of Mathematics 2026 Vol. 47 No. 2 P. 720–727
Добавлено: 16 июня 2026 г.
Enhancing Emotion Recognition in Speech Based on Self-Supervised Learning: Cross-Attention Fusion of Acoustic and Semantic Features
Deeb B., Савченко А. В., Макаров И. А., IEEE Access 2026 Vol. 13 P. 56283–56295
Добавлено: 16 июня 2026 г.
Automated detection of wolf howls using audio spectrogram transformers
Makarov N., Савченко А. В., Zemtsova I. и др., Scientific Reports 2025 Vol. 15 Article 26641
Добавлено: 16 июня 2026 г.
Artificial intelligence framework for multi-pathology risk assessment from retinal fundus images: deep learning approach to 15-disease screening
Vasilev R., Савченко А. В., Blinov P. и др., Frontiers in Medicine 2026 Vol. 13
Добавлено: 16 июня 2026 г.
From Data to Signs: A Foundation Model for Multilingual Sign Language Recognition
Novopoltsev M., Tulenkov A., Murtazin R. и др., IEEE Access 2025 Vol. 13 P. 188170–188181
Добавлено: 16 июня 2026 г.
Актуальные проблемы теоретической и прикладной лингвистики: опыт молодых исследователей. Cборник научных статей.
СПб.: Санкт-Петербургский государственный экономический университет, 2024.
Сборник научных статей подготовлен на кафедре английской филологии и перевода гуманитарного факультета Санкт-Петербургского государственного экономического университета. Он содержит исследования по актуальным проблемам современного языкознания, которые отражают современные тенденции развития науки о языке и присущую ей междис-циплинарность. Сборник адресован студентам, магистрантам, аспирантам и специалистам в области языкознания, а также широкому кругу читателей, интересующихся проблемами современной лингвистики. ...
Добавлено: 16 июня 2026 г.
B3Emo: Quantifying Affect as a Double-Edged Sword in Strategic LLM Interactions
Stepin A., Mozikov M., Kabanov A. и др., IEEE Access 2026 Vol. 14 P. 48127–48144
Добавлено: 16 июня 2026 г.
ESQA: Event Sequences Question Answering
Abdullaeva I., Karpukhin I., Filatov A. и др., IEEE Access 2026 Vol. 14 P. 59390–59408
Добавлено: 16 июня 2026 г.
Female aging in Eastern European advertising: semiosis, representation, reinterpretation
Запорожцева Л. Е., Semiotica 2026 P. 1–20
Добавлено: 16 июня 2026 г.
Русские тексты рубежа XVII–XVIII вв. в немецком издании «Травника» Маттиоли (Prag, 1563)
Лифшиц А. Л., Святохина Е. В., Одиссей: Человек в истории 2026 № 1 С. 156–173
Статья вводит в научный оборот новый источник по истории русского языка, науки и культуры конца XVII в. Многочисленные русские подписи к гравюрам были обнаружены в экземпляре «Травника» великого ренессансного ботаника и фармацевта Пьетро Андреа Маттиоли, изданного в Праге на немецком языке в 1563 г. Кроме транслитерации латинских названий, книга содержит чрезвычайно значительное число славянских фитонимов, ...
Добавлено: 15 июня 2026 г.
Дрожащие огни: что видел Лермонтов?
Лифшиц А. Л., Живая старина 2026 № 2 (130) С. 38–40
В заметке делается попытка увидеть ночной пейзаж глазами автора текста, давно ставшего школьной классикой. Традиционная интерпретация приписывает стихотворению народность, которой Лермонтов, вероятно, не имел в виду. Сопоставление с современными поэту текстами показывает, что родина Лермонтова не крестьянская, а мелкопоместная Россия степных губерний. ...
Добавлено: 15 июня 2026 г.
Колебания в употреблении протоартикля при одушевленных функциональных именах в готском языке и проблема «анафорической стадии» грамматикализации артикля
Пименова Н. Б., Индоевропейское языкознание и классическая филология 2026 Т. 30 № 2 С. 313–322
В статье анализируются некоторые примеры непоследовательного употребления анафорического артикля в готском языке (IV в. н.э., восточногерманская группа), который считается классическим примером языка, находящегося на первой, анафорической стадии грамматикализации артикля. Помимо описанных в литературе нарушений анафорического правила: контекстов с локативными именами и обозначениями ‘множества’ одушевленных лиц, — мы можем фиксировать неоднократные колебания артикля при именах berusjos, ...
Добавлено: 15 июня 2026 г.
A Note on the Qumran Version of Isa 5:18
von Büttner Сyrill, Textus 2024 No. 32/2 P. 156–167
Добавлено: 15 июня 2026 г.
Proceedings of the 19th Conference of the European Chapter of the Association for Computational Linguistics (Volume 1: Long Papers)
Association for Computational Linguistics, 2026.
Добавлено: 14 июня 2026 г.
Идеологема «искусственный интеллект» в образе сильного государства (по материалам российского и китайского медиадискурсов)
Романова Т. В., Бинштейн М. М., Медиалингвистика 2026 Т. 13 № 1 С. 28–50
В данной статье противопоставляется узкое и широкое понимание содержание термина ИИ, фиксируется история его появления. Функционирование термина ИИ рассматривается  в сопоставительном аспекте по данным российских и китайских медийных источников: ...
Добавлено: 14 июня 2026 г.
Proceedings of the 6th Workshop on Computational Approaches to Discourse, Context and Document-Level Inferences (CODI 2025)
Strube M., Braud C., Hardmeier C. и др., Suzhou: Association for Computational Linguistics, 2025.
Добавлено: 11 июня 2026 г.
Самосознание в зеркале метафоры: квантитативный анализ метафорической системы раннего творчества Уоллеса Стивенса (1879–1955)
Чихачева Д. В., Человек: образ и сущность. Гуманитарные аспекты 2026 № 2 С. 217–228
Данное исследование фокусируется на раннем периоде творчества американского поэта Уоллеса Стивенса. Проведенный квантитативный анализ позволил определить доминанты метафорической системы этого периода творчества. Было установлено, что центральным смыслообразующим концептом в метафорике раннего творчества У. Стивенса выступает «СУЩЕСТВО». Исследование показывает, что поэтическая картина мира автора в этот период характеризуется тотальным панвитализмом – У. Стивенс наделяет атрибутами субъектности ...
Добавлено: 11 июня 2026 г.
Актуальные проблемы теоретической и прикладной лингвистики: опыт молодых исследователей
Растворова Ю. С., Михайлов Т. М., СПб.: Санкт-Петербургский государственный экономический университет, 2024.
Сборник научных статей подготовлен на кафедре английской филологии и перевода гуманитарного факультета Санкт-Петербургского государственного экономического университета. Он содержит исследования по актуальным проблемам современного языкознания, которые отражают современные тенденции развития науки о языке и присущую ей междис-циплинарность. Сборник адресован студентам, магистрантам, аспирантам и специалистам в области языкознания, а также широкому кругу читателей, интересующихся проблемами современной лингвистики. ...
Добавлено: 10 июня 2026 г.
Juxtapositional vs. possessive-like encoding in Russian specificational constructions
Логвинова Н. Н., Russian linguistics 2026 Vol. 50 Article 11
Добавлено: 18 мая 2026 г.
Proceedings of the 9th Student Research Workshop associated with the International Conference Recent Advances in Natural Language Processing
Velichkov B., Nikolova-Koleva I., Slavcheva M., Shumen: INCOMA Ltd, 2025.
Добавлено: 12 мая 2026 г.
Речевые акты с вежливыми диминутивами: жанровые и дискурсивные особенности
Фуфаева И. В., Вестник Волгоградского государственного университета. Серия 2: Языкознание 2025 Т. 24 № 4 С. 78–90
Речевые акты, в которых используются диминутивы как средство вежливости, рассмотрены с точки зрения их дискурсивной и жанровой принадлежности. Материалом исследования послужили авторские записи разговорной речи, данные Национального корпуса русского языка, сделанные в 1970-е гг. и на рубеже ХХ-ХХI вв. записи городской речи, содержащиеся в научных публикациях. В статье обоснована возможность употребления вежливых диминутивов в любых ...
Добавлено: 2 мая 2026 г.
Rubic2: Ensemble Model for Russian Lemmatization
Афанасьев И. А., Glazkova A., Ляшевская О. Н. и др., , in: Proceedings of the 10th Workshop on Slavic Natural Language Processing (Slavic NLP 2025).: Association for Computational Linguistics, 2025. P. 157–170.
Добавлено: 10 марта 2026 г.
Proceedings of the 10th Workshop on Slavic Natural Language Processing (Slavic NLP 2025)
Association for Computational Linguistics, 2025.
Добавлено: 10 марта 2026 г.
Transformer-based approaches for lemmatizing abbreviations in Russian texts
Glazkova A., Ляшевская О. Н., Morozov D. и др., Journal of Mathematical Sciences 2025 Vol. 546 P. 32–47
Добавлено: 10 марта 2026 г.
  • О ВЫШКЕ
  • Цифры и факты
  • Руководство и структура
  • Устойчивое развитие в НИУ ВШЭ
  • Преподаватели и сотрудники
  • Корпуса и общежития
  • Закупки
  • Обращения граждан в НИУ ВШЭ
  • Фонд целевого капитала
  • Противодействие коррупции
  • Сведения о доходах, расходах, об имуществе и обязательствах имущественного характера
  • Сведения об образовательной организации
  • Людям с ограниченными возможностями здоровья
  • Единая платежная страница
  • Работа в Вышке
  • ОБРАЗОВАНИЕ
  • Лицей
  • Довузовская подготовка
  • Олимпиады
  • Прием в бакалавриат
  • Вышка+
  • Прием в магистратуру
  • Аспирантура
  • Дополнительное образование
  • Центр развития карьеры
  • Бизнес-инкубатор ВШЭ
  • Образовательные партнерства
  • Обратная связь и взаимодействие с получателями услуг
  • НАУКА
  • Научные подразделения
  • Исследовательские проекты
  • Мониторинги
  • Диссертационные советы
  • Защиты диссертаций
  • Академическое развитие
  • Конкурсы и гранты
  • Внешние научно-информационные ресурсы
  • РЕСУРСЫ
  • Библиотека
  • Издательский дом ВШЭ
  • Книжный магазин «БукВышка»
  • Типография
  • Медиацентр
  • Журналы ВШЭ
  • Публикации
  • http://www.minobrnauki.gov.ru/
    Министерство науки и высшего образования РФ
  • https://edu.gov.ru/
    Министерство просвещения РФ
  • http://www.edu.ru
    Федеральный портал «Российское образование»
  • https://elearning.hse.ru/mooc
    Массовые открытые онлайн-курсы
  • НИУ ВШЭ1993–2026
  • Адреса и контакты
  • Условия использования материалов
  • Политика конфиденциальности
  • Правила применения рекомендательных технологий в НИУ ВШЭ
  • Карта сайта
Редактору