• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • A
  • A
  • A
  • A
  • A
Обычная версия сайта
  • RU
  • EN
  • Национальный исследовательский университет «Высшая школа экономики»
  • Публикации ВШЭ
  • Глава
  • From web to dialects: how to enhance non-standard Russian lects lemmatisation?
  • RU
  • EN
Расширенный поиск
Высшая школа экономики
Национальный исследовательский университет
Приоритетные направления
  • бизнес-информатика
  • государственное и муниципальное управление
  • гуманитарные науки
  • инженерные науки
  • компьютерно-математическое
  • математика
  • менеджмент
  • право
  • социология
  • экономика
по году
  • 2027
  • 2026
  • 2025
  • 2024
  • 2023
  • 2022
  • 2021
  • 2020
  • 2019
  • 2018
  • 2017
  • 2016
  • 2015
  • 2014
  • 2013
  • 2012
  • 2011
  • 2010
  • 2009
  • 2008
  • 2007
  • 2006
  • 2005
  • 2004
  • 2003
  • 2002
  • 2001
  • 2000
  • 1999
  • 1998
  • 1997
  • 1996
  • 1995
  • 1994
  • 1993
  • 1992
  • 1991
  • 1990
  • 1989
  • 1988
  • 1987
  • 1986
  • 1985
  • 1984
  • 1983
  • 1982
  • 1981
  • 1980
  • 1979
  • 1978
  • 1977
  • 1976
  • 1975
  • 1974
  • 1973
  • 1972
  • 1971
  • 1970
  • 1969
  • 1968
  • 1967
  • 1966
  • 1965
  • 1964
  • 1963
  • 1958
  • еще
Тематика
Новости
30 апреля 2026 г.
«Моя цель - стать ординарным профессором»
Михаил Саматов занимается теоретическими исследованиями перовскитных солнечных батарей. В интервью проекту «Молодые ученые Вышки» он рассказал о работе на суперкомпьютере Вышки, сотрудничестве с Пекинским университетом и умении делать мебель.
29 апреля 2026 г.
Научить машину читать прошлое: на ФГН создают нейросеть для расшифровки рукописей
Дневники и письма — бесценный источник для гуманитария-исследователя. Но что делать, если текст невозможно прочитать? На факультете гуманитарных наук (ФГН) ВШЭ эту проблему решили перевести на язык математики: команда филологов, историков и специалистов по машинному обучению создала информационную систему, которая не только распознает неразборчивый почерк, но и помогает анализировать содержание архивов.
29 апреля 2026 г.
8 драйверов технологического будущего: что изменит экономику
Какие отрасли определят облик ближайших десятилетий? Премьер-министр  Михаил Мишустин назвал 8 направлений, которые будут развиваться в ближайшие годы. О том, какие образовательные программы НИУ ВШЭ готовят специалистов по этим направлениям — в материале IQ медиа.

 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!

Публикации
  • Книги
  • Статьи
  • Главы в книгах
  • Препринты
  • Верификация публикаций
  • Расширенный поиск
  • Правила использования материалов
  • Наука в ВШЭ

?

From web to dialects: how to enhance non-standard Russian lects lemmatisation?

P. 167–175.
Афанасьев И. А., Ляшевская О. Н.
Язык: английский
Полный текст
Текст на другом сайте
Ключевые слова: Russian languagemorphological tagginglemmatizationRussian dialectslearning with small data

В книге

Proceedings of the 2023 CLASP Conference on Learning with Small Data (LSD)
Gothenburg: Association for Computational Linguistics, 2023.
Похожие публикации
Дискриминативная лемматизация сокращений в эпоху LLM
Глазкова А. В., Смаль И. В., Ляшевская О. Н. и др., Доклады Российской академии наук. Математика, информатика, процессы управления (ранее - Доклады Академии Наук. Математика) 2025 Т. 527 С. 146–155
В работе представлено исследование эффективности дискриминативных методов лемматизации сокращений в русскоязычных текстах. В отличие от генеративных подходов, дискриминативные модели осуществляют выбор оптимальной леммы из фиксированного набора вариантов, что исключает риск генерации грамматически некорректных словоформ. Впервые для русского языка проводится комплексный анализ четырех контекстно-ориентированных подходов: (1) ранжирования на основе маскированного языкового моделирования, (2) бинарной классификации, (3) ...
Добавлено: 10 марта 2026 г.
Rubic2: Ensemble Model for Russian Lemmatization
Афанасьев И. А., Glazkova A., Ляшевская О. Н. и др., , in: Proceedings of the 10th Workshop on Slavic Natural Language Processing (Slavic NLP 2025).: Association for Computational Linguistics, 2025. P. 157–170.
Добавлено: 10 марта 2026 г.
Transformer-based approaches for lemmatizing abbreviations in Russian texts
Glazkova A., Ляшевская О. Н., Morozov D. и др., Journal of Mathematical Sciences 2025 Vol. 546 P. 32–47
Добавлено: 10 марта 2026 г.
Правовое положение соотечественников, проживающих в постсоветских странах, в условиях нестабильной международной обстановки
Затулин К. Ф., Егоров В. Г., Докучаева А. В. и др., М.: Институт диаспоры и интеграции (Институт стран СНГ), 2025.
Книга «Правовое положение соотечественников, проживающих в постсоветских странах, в условиях нестабильной международной обстановки» содержит результаты исследования, проведенного в Абхазии, Азербайджане, Армении, Беларуси, Грузии, Казахстане, Киргизии, Латвии, Литве, Молдове, Приднестровской Молдавской Республике, Таджикистане, Узбекистане, Эстонии и Южной Осетии. Исследование выполнено Институтом диаспоры и интеграции (Институтом стран СНГ) в 2024 году. Оно включило в себя анализ нормативно-правовых ...
Добавлено: 3 февраля 2026 г.
Методика обучения младших школьников чтению на русском и английском языках: сходство и различие
[б.и.], 2022.
В статье освещается важность роли обучения чтению детей, ее специфические особенности и составляющие; рассмотрены основные приемы и методики, используемые при обучении чтению детей как на русском, так и на английском языках; проведена сравнительная характеристика двух языков. Кроме того, в статье также сравнивается методики обучения чтению по русскому и английскому языку для того, чтобы найти слабые ...
Добавлено: 31 января 2026 г.
Semi-fake indexicals in Russian
Тискин Д. Б., Типология морфосинтаксических параметров 2025 Vol. 8 No. 1 P. 112–129
Добавлено: 26 января 2026 г.
Некоторые модификации к теории связанных употреблений индексальных выражений И. Басси
Тискин Д. Б., Типология морфосинтаксических параметров 2024 Т. 7 № 1 С. 107–123
Связанные употребления индексальных выражений (fake indexicals, FI), в т. ч. личных местоимений 1 и 2 лица, анализируются И. Басси [Bassi 2021] как результат постсинтаксического процесса, обращающегося к признакам референта местоимения. Это приводит к экстравагантному описанию синтаксиса и семантики относительных придаточных, включающих FI. Опираясь на данные русского языка, мы показываем способ вернуться к более традиционному описанию ...
Добавлено: 26 января 2026 г.
Nominative Object
Ронько Р. В., Wiemer B., , in: Encyclopedia of Slavic Languages and Linguistics Online.: Brill, 2020.
Добавлено: 19 декабря 2025 г.
Проблема формирования национального самосознания у детей в процессе изучения родного языка в трудах К. Д. Ушинского
Бизяева Н. Д., Проблемы современного образования 2025 № 4 С. 134–141
Статья является результатом осмысления взглядов К. Д. Ушинского на проблему формирования национального самосознания у детей в процессе изучения родного языка. Было определено, что идея народности, выраженная в теоретических и аксиологических установках Константина Дмитриевича Ушинского, достаточно ярко была представлена в программе обучения детей «Родному слову». В ходе изучения трудов выдающегося педагогического мыслителя второй половины XIX в. ...
Добавлено: 16 декабря 2025 г.
Detecting Ethnic Conflict in Social Media with Transformers and Augmented Data
Кольцова Е. Ю., Сурков А. Ю., Procedia Computer Science 2025 Vol. 258 P. 2382–2390
Добавлено: 28 ноября 2025 г.
Речевые акты с вежливыми диминутивами: жанровые и дискурсивные особенности
Фуфаева И. В., Вестник Волгоградского государственного университета. Серия 2: Языкознание 2025 Т. 24 № 4 С. 78–90
Речевые акты, в которых используются диминутивы как средство вежливости, рассматриваются в статье в аспектах их дискурсивной и жанровой принадлежности. Материалом исследования послужили авторские записи разговорной речи; данные Национального корпуса русского языка и записей городской речи, сделанных в 1970-е гг. и на рубеже ХХ-ХХI вв. В статье отмечается возможность употребления вежливых диминутивов в любых дискурсах, связанных ...
Добавлено: 25 ноября 2025 г.
Интерпретация сложных предложений с разными типами матричных предикатов в контексте отрицания и модальных операторов
Летучий А. Б., Russian Linguistics 2025 Т. 49 № 2 Статья 2
В статье обсуждаются типы интерпретации русских сложных предложений с фактивными, импликативными и интерпретационными предикатами в контексте отрицанияи модальных операторов. По умолчанию мы ожидаем, что отрицательный или модальный контекст затрагивает только главную пропозицию. Однако есть и немало исключений, которые мы называем «прозрачными прочтениями»: речь идёт о прочтениях, вкоторых внешний контекст семантически затрагивает и главную, и зависимую ...
Добавлено: 5 ноября 2025 г.
Building a Clean Bartangi Language Corpus and Training Word Embeddings for Low-Resource Language Modeling
Shumen: INCOMA Ltd, 2025.
Добавлено: 20 октября 2025 г.
Case selection for the direct object of negated verbs in Russian dialects
Ронько Р. В., Malysheva A., , in: Convergence and Divergence in the Eastern Circum-Baltic Area: Volume 1: The Northern Part - A Synthetic View, especially on Finnic, and Case StudiesVol. 1: The Northern Part - A Synthetic View, especially on Finnic, and Case Studies.: De Gruyter Mouton, 2025. Ch. 8 P. 571–587.
Добавлено: 27 сентября 2025 г.
The Nominative Object in modern Northern and Western Russian dialects
Ронько Р. В., , in: Convergence and Divergence in the Eastern Circum-Baltic Area: Volume 1: The Northern Part - A Synthetic View, especially on Finnic, and Case StudiesVol. 1: The Northern Part - A Synthetic View, especially on Finnic, and Case Studies.: De Gruyter Mouton, 2025. P. 589–606.
Добавлено: 27 сентября 2025 г.
Gender stereotypes in agreement processing with role nouns: a study on Russian
Слюсарь Н. А., Антропова Д. В., Frontiers in Psychology 2025 Vol. 16 Article 1619505
Добавлено: 22 сентября 2025 г.
Новые номинации мужчин в молодежном сленге
Кронгауз М. А., Труды института русского языка им. В.В. Виноградова 2025 № 3(45) С. 159–167
В статье рассматривается современный молодежный сленг, а именно номинации мужчин, появившиеся в самое последнее время: анк(л), масик, нормис, сигма, скуф, тюбик, чечик, штрих. Обращается внимание на то, что слова масик, тюбик, чечик, штрих часто в интернете обсуждаются вместе и имеют общие семантические и прагматические характеристики. Они обозначают типажи мужчин в соответствии с их пригодностью к ...
Добавлено: 17 сентября 2025 г.
  • О ВЫШКЕ
  • Цифры и факты
  • Руководство и структура
  • Устойчивое развитие в НИУ ВШЭ
  • Преподаватели и сотрудники
  • Корпуса и общежития
  • Закупки
  • Обращения граждан в НИУ ВШЭ
  • Фонд целевого капитала
  • Противодействие коррупции
  • Сведения о доходах, расходах, об имуществе и обязательствах имущественного характера
  • Сведения об образовательной организации
  • Людям с ограниченными возможностями здоровья
  • Единая платежная страница
  • Работа в Вышке
  • ОБРАЗОВАНИЕ
  • Лицей
  • Довузовская подготовка
  • Олимпиады
  • Прием в бакалавриат
  • Вышка+
  • Прием в магистратуру
  • Аспирантура
  • Дополнительное образование
  • Центр развития карьеры
  • Бизнес-инкубатор ВШЭ
  • Образовательные партнерства
  • Обратная связь и взаимодействие с получателями услуг
  • НАУКА
  • Научные подразделения
  • Исследовательские проекты
  • Мониторинги
  • Диссертационные советы
  • Защиты диссертаций
  • Академическое развитие
  • Конкурсы и гранты
  • Внешние научно-информационные ресурсы
  • РЕСУРСЫ
  • Библиотека
  • Издательский дом ВШЭ
  • Книжный магазин «БукВышка»
  • Типография
  • Медиацентр
  • Журналы ВШЭ
  • Публикации
  • http://www.minobrnauki.gov.ru/
    Министерство науки и высшего образования РФ
  • https://edu.gov.ru/
    Министерство просвещения РФ
  • http://www.edu.ru
    Федеральный портал «Российское образование»
  • https://elearning.hse.ru/mooc
    Массовые открытые онлайн-курсы
  • НИУ ВШЭ1993–2026
  • Адреса и контакты
  • Условия использования материалов
  • Политика конфиденциальности
  • Правила применения рекомендательных технологий в НИУ ВШЭ
  • Карта сайта
Редактору