• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • A
  • A
  • A
  • A
  • A
Обычная версия сайта
  • RU
  • EN
  • HSE University
  • Publications
  • Book chapter
  • Анализ ошибок морфологического анализатора MyStem при работе с записями детской речи
  • RU
  • EN
Расширенный поиск
Высшая школа экономики
Национальный исследовательский университет
Priority areas
  • business informatics
  • economics
  • engineering science
  • humanitarian
  • IT and mathematics
  • law
  • management
  • mathematics
  • sociology
  • state and public administration
by year
  • 2027
  • 2026
  • 2025
  • 2024
  • 2023
  • 2022
  • 2021
  • 2020
  • 2019
  • 2018
  • 2017
  • 2016
  • 2015
  • 2014
  • 2013
  • 2012
  • 2011
  • 2010
  • 2009
  • 2008
  • 2007
  • 2006
  • 2005
  • 2004
  • 2003
  • 2002
  • 2001
  • 2000
  • 1999
  • 1998
  • 1997
  • 1996
  • 1995
  • 1994
  • 1993
  • 1992
  • 1991
  • 1990
  • 1989
  • 1988
  • 1987
  • 1986
  • 1985
  • 1984
  • 1983
  • 1982
  • 1981
  • 1980
  • 1979
  • 1978
  • 1977
  • 1976
  • 1975
  • 1974
  • 1973
  • 1972
  • 1971
  • 1970
  • 1969
  • 1968
  • 1967
  • 1966
  • 1965
  • 1964
  • 1963
  • 1958
  • More
Subject
News
May 25, 2026
HSE Scientists Train Neural Network to 'Hear' Faults in Electric Motors
Researchers at the AI and Digital Science Institute of the HSE Faculty of Computer Science have developed a new method—the Signature-Guided Data Augmentation (SGDA) framework—that achieves 99% accuracy in motor fault detection and 86% accuracy in fault classification. The application of this approach can reduce industrial equipment repair costs, minimise downtime, and improve production safety. The study results have been published in Engineering Applications of Artificial Intelligence.
May 25, 2026
'The Humanities Serve as a Conscience'
Maria Mizernaia studies Soviet literature and the history of book publishing. In this interview for the HSE Young Scientists project, she discusses plans to publish a novel about besieged Leningrad, AI-provoked reflections on what it means to be human, and how novels can help satisfy our dopamine hunger.
May 25, 2026
Is It Possible to Predict a Citys Life Based on the Shape of Its Neighbourhoods?
Is it possible to predict, based on the configuration of streets and buildings, where a café will open or where traffic congestion will occur? Participants in the Spatial Analysis and Modelling of Urban Processes research and study group use open data and machine learning to identify universal patterns. Alexander Sheludkov and Eduard Somov discuss the purpose of comparing cities, the need for new forms of urban statistics, and how open data is transforming approaches to urban studies.

 

Have you spotted a typo?
Highlight it, click Ctrl+Enter and send us a message. Thank you for your help!

Publications
  • Books
  • Articles
  • Chapters of books
  • Working papers
  • Report a publication
  • Research at HSE

?

Анализ ошибок морфологического анализатора MyStem при работе с записями детской речи

С. 274–279.
Lelik V., Eremicheva T., Morozova D., Sycheva A., Ревак К. З., Псарёва Н. Н., Широков И. А., Dorofeeva S.

Some of the important conditions of the effectiveness of morphological analyzers are the correct recognition of unfamiliar words and successful morphological disambiguation. In this work, we evaluated the results of automatic processing of children’s spontaneous speech using the morphological analyzer MyStem. We analyzed the longitudinal spontaneous speech recordings of two bilingual children and their parents created according to the CHILDES protocol. The total length of the recordings was 956 minutes and 420 minutes, respectively. The analysis included 12,828 lines from the transcripts tagged by the parser. Based on the results of the research, we were able to determine the frequency of cases with morphological ambiguity and morphological analyzer errors, and we furthermore suggest a  typology of such errors and some possible ways of improving the work of the MyStem parser.

Language: Russian
Full text
Keywords: автоматическая обработка текстаchildren's speechдетская речьморфологическая омонимияautomatic text processingMorphological analyzerморфологический анализаторкорпус CHILDESmorphological homonymyCHILDES corpus

In book

Когнитивная наука в Москве: новые исследования. Материалы конференции 21–22 июня 2023 г.
Когнитивная наука в Москве: новые исследования. Материалы конференции 21–22 июня 2023 г.
М.: «Буки Веди», Московский институт психоанализа, 2023.
Similar publications
Natural hazard database from Internet publications: text mining with a large language model
Derkacheva A., Sakirkina M., Kraev G. et al., /. 2026.
Comprehensive data on natural hazards and their consequences are crucial for effective for risk assessment, adaptation planning, and emergency response. However, many countries face challenges with fragmented, inconsistent, and inaccessible data, particularly regarding local-scale events. To address this data gap in Russia, we developed an end-to-end processing pipeline that scrapes news from various online sources, ...
Added: April 28, 2026
Подражание и творчество в процессе освоения языка детьми
Trofimova N., Шумилова С. А., Дискурс 2025 Т. 10 № 6 С. 165–174
Since language acquisition is a gradual process, younger children have gaps in their mental grammar and mental lexicon. In order to be understood well while communicating with other people, they sometimes resort to creating new words, known as innovations, which remain unusual for the language norm. This article expounds the nature of children’s speech innovations and presents the analysis ...
Added: February 22, 2026
Морфологический гессер как инструмент анализа полевых данных: опыт работы с науканским языком
Будянская Е. М., Buzanov A., Жорник Д. О. et al., Томский журнал лингвистических и антропологических исследований 2025 № 2(48) С. 9–19
The paper presents the development and evaluation of two automated morphological analysis tools for Naukan Yupik (< Yupik < Eskimo < Eskimo-Aleut): a dictionary-based morphological analyzer and a dictionary-free morphological guesser. Both tools are implemented using a two-level approach to morphology modeling based on finite-state automata. The study examines in detail the morphological features of ...
Added: March 11, 2025
Разработка и апробация Индекса продуктивности синтаксиса при освоении именных групп русскоговорящими детьми
Diachkova M., Sekerina I. A., Dorofeeva S., В кн.: Когнитивная наука в Москве: новые исследования. Материалы конференции 21–22 июня 2023 г.: М.: «Буки Веди», Московский институт психоанализа, 2023. С. 583–587.
В рамках настоящего проекта было положено начало разработке Индекса продуктивности синтаксиса для именных групп - нового метода для оценки грамматической сложности образцов спонтанной речи русскоязычных детей. Такой инструмент был предложен в 1990 году для англоязычных детей, однако на базе русского языка подобные методы отсутствуют, речевой профиль маленьких детей чаще оценивается субъективно. Опираясь на оригинальный Индекс, ...
Added: July 12, 2024
Проект Chekhov Digital: задачи и проблемы реализации семантической разметки текстов (на примере рассказа А. П. Чехова «Смерть чиновника»)
Северина Е. М., Ларионова М. Ч., Litera 2023 № 10 С. 211–222
The article considers a model of preparation of machine-readable (semantic) markup of texts for the Chekhov Digital project on the example of philological interpretation of individual significant elements of A. P. Chekhov's story "Death of an Official" and presentation of this information explicitly based on the standards of digital publication Text Encoding Initiative (TEI/XML). Based ...
Added: January 12, 2024
Ранние этапы усвоения морфосинтаксиса детьми 1-3 ЛЕТ (по данным лонгитюдных записей)
Diachkova M., Lopukhina A., В кн.: Проблемы онтолингвистики - 2023: вариативность речевого онтогенеза.: СПб.: ООО "Издательство ВВМ", 2023. С. 55–59.
The study is devoted to the early stages of nominal and verbal grammar development in 1-3 year old Russian-speaking children. The research is based on longitudinal recordings of two children created according to the CHILDES protocol. We have identified the following trends in grammar development: indirect cases appear gradually, from accusative to instrumental case. The ...
Added: November 3, 2023
ВИЗУАЛИЗАЦИЯ ДАННЫХ В ЭМОЦИОНАЛЬНОМ АНАЛИЗЕ РУССКОЯЗЫЧНЫХ ИНТЕРНЕТ-ТЕКСТОВ НА ОСНОВЕ МОДЕЛИ "КУБ ЛЁВХЕЙМА"
Kolmogorova A., Калинин А. А., В кн.: Язык и искусственный интеллект: Сборник статей по итогам конференции «Лингвистический форум 2020: Язык и искусственный интеллект».: Издательский дом ЯСК, 2023. С. 167–181.
In the paper, we discuss the problem of tools supposed to be effective for visualization of data achieved as result of running algorithms for emotional text analysis. We start by overviewing some technics used to visualize data in projects devoted to exploratory data analysis, sentiment-analysis and emotional text analysis. To continue, we suggest two variants ...
Added: October 31, 2023
Обзор методов оценки сложности текстов в сфере регулирования банковской деятельности
Morkovkin A., Ilvovsky D., В кн.: ИТиС 2022: Сборник трудов 46-й междисциплинарной школы-конференции ИППИ РАН "Информационные технологии и системы 2022".: Институт проблем передачи информации им. А.А. Харкевича РАН, 2022.
The estimation of textual complexity is an important and relevant task in the field of natural language processing. For example, in the banking sector, according to experts, there is a trend towards increasing the complexity of texts in all areas of financial regulation, which makes them difficult to understand even by professionals. This can lead ...
Added: September 23, 2023
Building Dataset and Morpheme Segmentation Model for Russian Word Forms
Bolshakova E. I., Sapin A., , in: Computational Linguistics and Intellectual Technologies: Papers from the Annual International Conference “Dialogue” (2021)Issue 20: Основной том.: -, 2021. P. 154–161.
Added: October 30, 2021
Проблемы онтолингвистики - 2021: языковая система ребенка в ситуации одно- и многоязычия
СПб.: ООО "ВВМ", 2021.
В сборник вошли материалы ежегодной конференции, посвященной проблемам становления языковой системы ребенка в ситуации одно- и многоязычия. В докладах участников обсуждаются традиционные для современной онтолингвистики проблемы: освоение словарного состава языка и грамматики (словообразования, морфологии, синтаксиса), становление коммуникации и ее особенности, которые проявляются в разных ситуациях, влияние инпута на речевую деятельность детей, овладение письменной формой речи; ...
Added: September 5, 2021
Вариативность написаний в ранних детских письменных текстах
Akhapkina Y., В кн.: Современная онтолингвистика: проблемы, методы, открытия.: Иваново: ЛИСТОС, 2019. С. 69–73.
Идея интуитивного освоения письма в русле действия тех же механизмов, которые обеспечивают естественное освоение устной речи на родном языке, формулировалась в работах С. Н. Цейтлин и М. В. Русаковой (Цейтлин и др. 1999, Русакова 2013). Действительно, начинающие писать дошкольники бессознательно опираются на целый ряд закономерностей, вычленяемых из устного и письменного речевого образца (инпута): "Некоторые механизмы ...
Added: March 28, 2020
Современная онтолингвистика: проблемы, методы, открытия
Иваново: ЛИСТОС, 2019.
В сборник вошли материалы международной научной конференции «Современная онтолингвистика: проблемы, методы, открытия», которая прошла в Санкт-Петербурге 24–26 июня 2019 г. Авторы сборника – лингвисты, психологи, дефектологи, специалисты в области преподавания русского языка как родного и как иностранного. В докладах участников конференции прослеживаются основные направления исследований детской речи: становление грамматического строя русского языка, освоение словарного состава, ...
Added: March 28, 2020
Computational Linguistics and Intellectual Technologies Papers from the Annual International Conference “Dialogue” (2019)
M.: Russian State University for the Humanitie, 2019.
The book includes 64 papers submitted to the International conference in computer linguistics and intellectual technologies Dialogue 2019 and presents a broad spectrum of theoretical and applied research of natural language description, language simulation, and creation of applied computer technologies. ...
Added: October 16, 2019
Функции императивных форм дай/давай и их грамматикализованных вариантов в высказываниях детей
Воейкова М., Ivanova K., В кн.: Проблемы функциональной грамматики. Предикативные категории в высказывании и целостном тексте.Т. 6: Предикативные категории в высказывании и целостном тексте.: М.: Издательский дом ЯСК, 2017. С. 308–331.
The subject of the current chapter is the functions of perfective and imperfective imperatives of give-verbs dajand davaj. It is known that in the Russian language these forms are frequent and possess a wide functional range. Further grammaticalization of these forms shows a divergence, which can not be completely explained by the perfective-imperfective opposition in the imperative ...
Added: October 26, 2018
Система автоматического аннотирования текстов с помощью стохастической модели
Voznesenskaya T., Леднов Д. А., Машинное обучение и анализ данных 2018 Т. 4 № 4 С. 266–279
This paper is toward the system of automatic text summarization developed by «DC – Systems» company in cooperation with the faculty of computer science at HSE. The summary is a concise description of the text in terms of its content and meaning, i.e. from the point of view of its semantics. The purpose of the ...
Added: October 5, 2018
Тактики представления двух последовательных ситуаций в детском нарративе (на материале сочинений по картинке учеников 2 класса)
Akhapkina Y., В кн.: Проблемы онтолингвистики - 2018: Материалы международной научной конференции 20-23 марта 2018.: СПб.: ЛИСТОС, 2018. С. 363–368.
The research focuses on different ways of transition from the description of the previous action to the following static situation in prepared written texts written by 2-d form pupils. Three basic narrative techniques are discovered: both situations are comprehended as concrete and non-repeated; both situations are comprehended as typical and repeated; only the second (static) ...
Added: March 23, 2018
Проблемы онтолингвистики - 2018: Материалы международной научной конференции 20-23 марта 2018
СПб.: ЛИСТОС, 2018.
В книгу вошли материалы международной конференции, приуроченной к юбилею основоположника Санкт-Петербургсеой школы онтолингвистики профессора С. Н. Цейтлин. Лингвисты, физиологи, педагоги и логопеды рассматривают становление грамматической системы ребенка, освоение словарного состава языка, овладение звуковой стороной речи, освоение чтения и письма, становление коммуникативной и текстовой компетенций. ...
Added: March 23, 2018
Машинная лингвистика: от перевода со словарём к нелинейным динамическим системам
Volkova L. L., В кн.: Новые информационные технологии в автоматизированных системах: материалы шестнадцатого научно-технического семинара.: М.: Московский государственный институт электроники и математики, 2013. С. 317–328.
В статье дан краткий обзор ключевых этапов развития машинной лингвистики в разрезе анализа и синтеза текста. Выделены проблемы работы с языком, являющиеся фундаментальными ограничениями, отделяющими существующий уровень развития отрасли от качественно нового. Рассмотрены перспективные теории, предлагающие новый подход к рассмотрению языка и открывающие возможность заглянуть за барьер машинной лингвистики. ...
Added: January 31, 2018
Анализ грамматического частотного профиля лексем корпуса детской речи как метод изучения развития речи в норме и при первичном недоразвитии речи у дошкольников
Корнев А. Н., Балчюниене И., Воейкова М. Д. et al., Новые информационные технологии в автоматизированных системах 2016 № 19 С. 33–38
Среди разнообразных методов изучения детской речи до настоящего времени не предпринималось попыток количественного статистического анализа распределения грамматических категорий в текстах детей, как с нормой развития, так и при состояниях первичного недоразвития речи. Существует много свидетельств, что в процессе развития языка и речи ребенок начинает использовать синтаксически более сложные конструкции, включающие все более широкий круг знаменательных ...
Added: December 16, 2017
  • About
  • About
  • Key Figures & Facts
  • Sustainability at HSE University
  • Faculties & Departments
  • International Partnerships
  • Faculty & Staff
  • HSE Buildings
  • HSE University for Persons with Disabilities
  • Public Enquiries
  • Studies
  • Admissions
  • Programme Catalogue
  • Undergraduate
  • Graduate
  • Exchange Programmes
  • Summer University
  • Summer Schools
  • Semester in Moscow
  • Business Internship
  • Research
  • International Laboratories
  • Research Centres
  • Research Projects
  • Monitoring Studies
  • Conferences & Seminars
  • Academic Jobs
  • Yasin (April) International Academic Conference on Economic and Social Development
  • Media & Resources
  • Publications by staff
  • HSE Journals
  • Publishing House
  • iq.hse.ru: commentary by HSE experts
  • Library
  • Economic & Social Data Archive
  • Video
  • HSE Repository of Socio-Economic Information
  • HSE1993–2026
  • Contacts
  • Copyright
  • Privacy Policy
  • Site Map
Edit