• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • A
  • A
  • A
  • A
  • A
Обычная версия сайта
  • RU
  • EN
  • HSE University
  • Publications
  • Book chapter
  • Особенности построения морфопроцессора русского языка CrossMorphy
  • RU
  • EN
Расширенный поиск
Высшая школа экономики
Национальный исследовательский университет
Priority areas
  • business informatics
  • economics
  • engineering science
  • humanitarian
  • IT and mathematics
  • law
  • management
  • mathematics
  • sociology
  • state and public administration
by year
  • 2027
  • 2026
  • 2025
  • 2024
  • 2023
  • 2022
  • 2021
  • 2020
  • 2019
  • 2018
  • 2017
  • 2016
  • 2015
  • 2014
  • 2013
  • 2012
  • 2011
  • 2010
  • 2009
  • 2008
  • 2007
  • 2006
  • 2005
  • 2004
  • 2003
  • 2002
  • 2001
  • 2000
  • 1999
  • 1998
  • 1997
  • 1996
  • 1995
  • 1994
  • 1993
  • 1992
  • 1991
  • 1990
  • 1989
  • 1988
  • 1987
  • 1986
  • 1985
  • 1984
  • 1983
  • 1982
  • 1981
  • 1980
  • 1979
  • 1978
  • 1977
  • 1976
  • 1975
  • 1974
  • 1973
  • 1972
  • 1971
  • 1970
  • 1969
  • 1968
  • 1967
  • 1966
  • 1965
  • 1964
  • 1963
  • 1958
  • More
Subject
News
May 25, 2026
HSE Scientists Train Neural Network to 'Hear' Faults in Electric Motors
Researchers at the AI and Digital Science Institute of the HSE Faculty of Computer Science have developed a new method—the Signature-Guided Data Augmentation (SGDA) framework—that achieves 99% accuracy in motor fault detection and 86% accuracy in fault classification. The application of this approach can reduce industrial equipment repair costs, minimise downtime, and improve production safety. The study results have been published in Engineering Applications of Artificial Intelligence.
May 25, 2026
'The Humanities Serve as a Conscience'
Maria Mizernaia studies Soviet literature and the history of book publishing. In this interview for the HSE Young Scientists project, she discusses plans to publish a novel about besieged Leningrad, AI-provoked reflections on what it means to be human, and how novels can help satisfy our dopamine hunger.
May 25, 2026
Is It Possible to Predict a Citys Life Based on the Shape of Its Neighbourhoods?
Is it possible to predict, based on the configuration of streets and buildings, where a café will open or where traffic congestion will occur? Participants in the Spatial Analysis and Modelling of Urban Processes research and study group use open data and machine learning to identify universal patterns. Alexander Sheludkov and Eduard Somov discuss the purpose of comparing cities, the need for new forms of urban statistics, and how open data is transforming approaches to urban studies.

 

Have you spotted a typo?
Highlight it, click Ctrl+Enter and send us a message. Thank you for your help!

Publications
  • Books
  • Articles
  • Chapters of books
  • Working papers
  • Report a publication
  • Research at HSE

?

Особенности построения морфопроцессора русского языка CrossMorphy

С. 73–81.
Сапин А. С., Bolshakova E. I.
Language: Russian
Keywords: морфологический анализразрешение морфологической омонимииморфемный анализморфологические процессоры

In book

Новые информационные технологии в автоматизированных системах. Материалы двадцатого научно-практического семинара
Институт прикладной математики им. М.В. Келдыша РАН, 2017.
Similar publications
Автоматическое выявление побуждений в тексте: применение методов компьютерной лингвистики в работе эксперта-лингвиста
П.Е. Белова, А.К. Сафарян, В кн.: Научно-практическая конференция с международным участием "Национальные и международные тенденции и перспективы развития судебной экспертизы". Сборник докладов.: Н. Новгород: Изд-во ННГУ им. Н.И. Лобачевского, 2024.
В данной статье представлено описание системы автоматического поиска и извлечения побуждений из текстов на русском языке FindImper, основанной на поиске глагольных форм и синтаксических связей. Алгоритм реализован на языке программирования Python с использованием библиотек для морфологического и синтаксического анализа и набора правил. Данный инструмент направлен на оптимизацию работы эксперта-лингвиста и доступен к использованию через веб-сайт ...
Added: January 30, 2026
BERT-like Models for Slavic Morpheme Segmentation
Morozov D., Astapenka L., Glazkova A. et al., , in: Proceedings of the 62nd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers)Vol. 1: Long papers.: Association for Computational Linguistics, 2025. P. 6795–6815.
Automatic morpheme segmentation algorithms are applicable in various tasks, such as building tokenizers and language education. For Slavic languages, the development of such algorithms is complicated by the rich derivational capabilities of these languages. Previous research has shown that, on average, these algorithms have already reached expert-level quality. However, a key unresolved issue is the ...
Added: July 17, 2025
Automatic Morpheme Segmentation for Russian: Can an Algorithm Replace Experts?
Morozov D., Garipov T., Lyashevskaya O. et al., Journal of Language and Education 2024 Vol. 10 No. 4 P. 71–84
Introduction: Numerous algorithms have been proposed for the task of automatic morpheme segmentation of Russian words. Due to the differences in task formulation and datasets utilized, comparing the quality of these algorithms is challenging. It is unclear whether the errors in the models are due to the ineffectiveness of algorithms themselves or to errors and inconsistencies ...
Added: January 7, 2025
Автоматизация процесса поиска побуждений и извлечения их из текста.
Белова П.Е., Safaryan A., В кн.: Современный медиатекст и судебная экспертиза: междисциплинарные связи и экспертная оценка: сборник научных работ по итогам Международной научно-практической конференции «Современный медиатекст и судебная экспертиза: междисциплинарные связи и экспертная оценка».: М.: ООО «СОЮЗКНИГ», 2023. С. 46–56.
В статье представлено описание системы автоматического поиска и извлечения побуждений из текстов на русском языке FindImper, основанной на поиске глагольных форм, выражающих значение побуждения, и реализованной на языке Python с использованием библиотек для морфологического и синтаксического анализа и набора правил. ...
Added: October 29, 2023
Инкрементальное предсказание морфологической парадигмы неизвестных слов русского языка
Lyukina E. V., Lytaeva M. A., Вестник Томского государственного университета. Филология 2020 № 68 С. 27–41
The article is dedicated to a new method for predicting the morphological paradigm of unknown (non-dictionary) words in the Russian language. The method allows in incremental mode automatically predict the morphological paradigm of the word. The method is based on ensemble prediction of the morphological paradigm from single wordform and the formation of partial paradigms ...
Added: December 11, 2020
Automatic Morphemic Analysis of Russian Words
Мальтина Л. П., Malafeev A., , in: Supplementary Proceedings of the 7th International Conference on Analysis of Images, Social Networks and Texts (AIST-SUP 2018), Moscow, Russia, July 5-7, 2018.: Aachen: CEUR Workshop Proceedings, 2018. Ch. 9 P. 85–94.
The paper considers the task of the morphemic analysis of Russian words and compares the efficiency of several proposed models. These models can be divided into three groups: derivational and inflectional rule-based, proba- bilistic, and hybrid models. The latter achieved state-of-the-art results of 0.848 F-score on a test set of 500 Russian words. The models ...
Added: February 15, 2019
MorphoRuEval-2017: an Evaluation Track for the Automatic Morphological Analysis Methods for Russian
Sorokin A., Shavrina T., Lyashevskaya O. et al., , in: Computational Linguistics and Intellectual Technologies. International Conference "Dialogue 2017" ProceedingsVol. 1. Issue 16 (23).: M.: -, 2017. P. 297–313.
MorphoRuEval-2017 is an evaluation campaign designed to stimulate the development of the automatic morphological processing technologies for Russian, both for normative texts (news, fiction, nonfiction) and those of less formal nature (blogs and other social media). This article compares the methods participants used to solve the task of morphological analysis. It also discusses the problem ...
Added: October 9, 2018
A morphological analyser for Maltese
Ravishankar V., Tyers F. M., Gatt A., Procedia Computer Science 2017 Vol. 117 P. 175–182
This article describes the development of a free/open-source morphological description of Maltese, originally created as the analysis component in a rule-based machine translation system for Maltese to Arabic and later applied to other tasks. The lexicon formalism we use is lttoolbox, part of the Apertium machine translation platform. An evaluation of the analyser shows that ...
Added: November 10, 2017
Орфографические соседи в русском языке: база данных и эксперимент, направленный на изучение морфологической декомпозиции
Alexeeva S., Slioussar N., Вопросы психолингвистики 2017 Т. 32 С. 12–27
В целом ряде психолингвистических экспериментов исследуется влияние на восприятие слова близких по написанию слов, или орфографических соседей (например, крот – корт). Обращение к такому материалу позволяет выявить некоторые закономерности восприятия графического облика слов при чтении и поиска слов в ментальном лексиконе, а также пролить свет на ряд других актуальных для психолингвистики проблем. Однако на материале ...
Added: October 9, 2017
Automatic Disambiguation in the Corpora of Modern Greek and Yiddish
Kuzmenko E., Mustakimova E., , in: Компьютерная лингвистика и интеллектуальные технологии. По материалам ежегодной Международной конференции "Диалог" (2015).: М.: Изд-во РГГУ, 2015. P. 388–398.
The problem of morphological ambiguity is widely addressed in the modern NLP. Mostly ambiguity is resolved with the use of large manually-annotated corpora and machine learning. However, such methods are not always available, as good training data is not accessible for all languages. In this paper we present a method of disambiguation without gold standard ...
Added: July 30, 2015
ПРИМЕНЕНИЕ МОРФОЛОГИЧЕСКОГО АНАЛИЗА ДЛЯ ОБОСНОВАНИЯ УПРАВЛЕНЧЕСКИХ РЕШЕНИЙ В ЛОГИСТИКЕ
Borisova L. A., В кн.: Инновационные технологии в логистике и управлении цепями поставок.: М.: Эс-Си-Эм Консалтинг, 2015. С. 81–90.
В случаях, когда не хватает достоверной информации для построения финансовой или имитационной моделей компании применяются морфологические матрицы для обоснования стратегических решений в логистике. Морфологический анализ–средство изучения всевозможных комбинаций вариантов управленческих решений, предлагаемых для формирования логистической стратегии компании. Если записать в столбец все функции логистической системы, а затем напротив каждой функции построчно указать всевозможные варианты ее ...
Added: June 29, 2015
Daba: a model and tools for Manding corpora
Kirill Maslinsky, , in: TALN-RECITAL 2014 Workshop TALAf 2014 : Traitement Automatique des Langues Africaines (TALAf 2014: African Language Processing).: Marseille: Association pour le Traitement Automatique des Langues, 2014. P. 114–122.
This article provides a brief overview of Daba software package created in the course of building corpora for Manding languages. Key software features are motivated by the tasks and problems characteristic of many African languages. The corpus-building model proposed here was initially developed for Bambara Reference Corpus which is available online and is freely accessible. ...
Added: March 26, 2015
Зачем нам нужны технологии поиска и анализа неструктурированной информации? Как оценить экономический эффект? (часть 1)
Romanov D. A., Современные технологии делопроизводства и документооборота 2014 № 9 С. 21–30
В первой части статьи рассмотрены некоторые базовые технологии для анализа и поиска неструктурированной текстовой информации - морфологический, синтаксический и семантический анализ, анализ эмоциональной окраски, выделение именованных сущностей, фактов и мнений, поиск похожих документов, автоаннотирование, анлиз информационных потоков в социальных сетях и др. ...
Added: March 19, 2015
Начальные этапы анализа текста
Klyshinskiy E., В кн.: Автоматическая обработка текстов на естественном языке и компьютерная лингвистика.: М.: Московский государственный институт электроники и математики, 2011. С. 106–140.
В данном разделе дается информация о начальных этапах анализа текстов на естественном языке: графематический, морфологический, предсинтаксический. Приводятся методы построения программных систем для реализации указанных этапов. ...
Added: April 12, 2012
  • About
  • About
  • Key Figures & Facts
  • Sustainability at HSE University
  • Faculties & Departments
  • International Partnerships
  • Faculty & Staff
  • HSE Buildings
  • HSE University for Persons with Disabilities
  • Public Enquiries
  • Studies
  • Admissions
  • Programme Catalogue
  • Undergraduate
  • Graduate
  • Exchange Programmes
  • Summer University
  • Summer Schools
  • Semester in Moscow
  • Business Internship
  • Research
  • International Laboratories
  • Research Centres
  • Research Projects
  • Monitoring Studies
  • Conferences & Seminars
  • Academic Jobs
  • Yasin (April) International Academic Conference on Economic and Social Development
  • Media & Resources
  • Publications by staff
  • HSE Journals
  • Publishing House
  • iq.hse.ru: commentary by HSE experts
  • Library
  • Economic & Social Data Archive
  • Video
  • HSE Repository of Socio-Economic Information
  • HSE1993–2026
  • Contacts
  • Copyright
  • Privacy Policy
  • Site Map
Edit