• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • A
  • A
  • A
  • A
  • A
Обычная версия сайта
  • RU
  • EN
  • Национальный исследовательский университет «Высшая школа экономики»
  • Публикации ВШЭ
  • Глава
  • Анализ ошибок морфологического анализатора MyStem при работе с записями детской речи
  • RU
  • EN
Расширенный поиск
Высшая школа экономики
Национальный исследовательский университет
Приоритетные направления
  • бизнес-информатика
  • государственное и муниципальное управление
  • гуманитарные науки
  • инженерные науки
  • компьютерно-математическое
  • математика
  • менеджмент
  • право
  • социология
  • экономика
по году
  • 2027
  • 2026
  • 2025
  • 2024
  • 2023
  • 2022
  • 2021
  • 2020
  • 2019
  • 2018
  • 2017
  • 2016
  • 2015
  • 2014
  • 2013
  • 2012
  • 2011
  • 2010
  • 2009
  • 2008
  • 2007
  • 2006
  • 2005
  • 2004
  • 2003
  • 2002
  • 2001
  • 2000
  • 1999
  • 1998
  • 1997
  • 1996
  • 1995
  • 1994
  • 1993
  • 1992
  • 1991
  • 1990
  • 1989
  • 1988
  • 1987
  • 1986
  • 1985
  • 1984
  • 1983
  • 1982
  • 1981
  • 1980
  • 1979
  • 1978
  • 1977
  • 1976
  • 1975
  • 1974
  • 1973
  • 1972
  • 1971
  • 1970
  • 1969
  • 1968
  • 1967
  • 1966
  • 1965
  • 1964
  • 1963
  • 1958
  • еще
Тематика
Новости
28 апреля 2026 г.
Почему слабые участники соревнований сдаются - и как это изменить
Доцент факультета экономических наук НИУ ВШЭ Анастасия Анцыгина разработала модель распределения призов, которая максимально стимулирует активность участников соревнований. Она предложила пересмотреть классический принцип «победитель получает все» и в некоторых случаях предлагать небольшую награду даже проигравшему. По ее мнению, это может повысить мотивацию участников и сделать соревнование более конкурентным. Результаты исследования опубликованы в журнале Economic Theory.
28 апреля 2026 г.
Исследователи НИУ ВШЭ собрали научную базу данных для изучения пищевых привычек у детей
Созданная в Высшей школе экономики база данных может стать основой для изучения пищевых привычек у детей. Об этом говорится в исследовании «Влияние возрастных, гендерных и социально-ролевых факторов на соответствие пищевого выбора детей возрастным нормам: экспериментальное исследование с веб-приложением Dish-I-Wish». Работа выполнена в рамках Программы фундаментальных исследований НИУ ВШЭ. Исследование было представлено в рамках XXVI Апрельской международной научной конференции.
27 апреля 2026 г.
«Уезжаешь с чемоданом новых идей и гипотез»
Апрельская международная научная конференция ежегодно привлекает молодых исследователей из разных регионов России. С 2019 года они могут принять участие в конкурсе, организованном НИУ ВШЭ, по итогам которого им компенсируются расходы на проезд и проживание в Москве. В этом году на конкурс поступило 17 заявок, было отобрано 8. Своими впечатлениями от конференции поделились его победители.

 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!

Публикации
  • Книги
  • Статьи
  • Главы в книгах
  • Препринты
  • Верификация публикаций
  • Расширенный поиск
  • Правила использования материалов
  • Наука в ВШЭ

?

Анализ ошибок морфологического анализатора MyStem при работе с записями детской речи

С. 274–279.
Лелик В. П., Еремичева Т. А., Морозова Д. А., Сычева А. С., Ревак К. З., Псарёва Н. Н., Широков И. А., Дорофеева С. В.

Одно из условий эффективной работы автоматических морфологических анализаторов — это корректное распознавание незнакомых слов и успешное снятие морфологической омонимии. В настоящей работе оценивались результаты автоматиче- ской обработки расшифровок спонтанной детской речи с помощью морфологического анализатора MyStem. Материалами для исследования послужили лонгитюдные записи спонтанной речи двух детей-билингвов и их родителей, созданные по протоколу корпу- са CHILDES. Общая длина записей составила 956 минут и 420 минут для каждого ребен- ка соответственно. В анализ вошли 12 828 строк, размеченных парсером. В результате проведенного исследования нам удалось определить частоту встречаемости случаев с морфологической неоднозначностью и с ошибками морфологического анализатора, а также предложить типологию таких ошибок и направления для возможного усовер- шенствования работы парсера MyStem.

Язык: русский
Полный текст
Ключевые слова: автоматическая обработка текстаchildren's speechдетская речьморфологическая омонимияautomatic text processingMorphological analyzerморфологический анализаторкорпус CHILDESmorphological homonymyCHILDES corpus

В книге

Когнитивная наука в Москве: новые исследования. Материалы конференции 21–22 июня 2023 г.
Когнитивная наука в Москве: новые исследования. Материалы конференции 21–22 июня 2023 г.
М.: «Буки Веди», Московский институт психоанализа, 2023.
Похожие публикации
Подражание и творчество в процессе освоения языка детьми
Трофимова Н. А., Шумилова С. А., Дискурс 2025 Т. 10 № 6 С. 165–174
В статье изложены результаты исследования детской речи, цель которого – выявление речевых инноваций, или окказионализмов. Под речевыми инновациями онимаются лексические единицы, встретившиеся в речи ребенка, но при этом отсутствующие в конвенциональном языке взрослых. Цель статьи – проанализировать выявленные в детской речи окказионализмы и описать процесс их конструирования, опираясь на установленные в этой научной области факты – этапы ...
Добавлено: 22 февраля 2026 г.
Морфологический гессер как инструмент анализа полевых данных: опыт работы с науканским языком
Будянская Е. М., Бузанов А. О., Жорник Д. О. и др., Томский журнал лингвистических и антропологических исследований 2025 № 2(48) С. 9–19
В статье представлено описание разработки и оценки двух инструментов автоматического морфологического анализа для науканского языка (< юпикские < эскимосские < эскимосско-алеутские): морфологического анализатора со словарем и морфологического гессера без словаря. Оба инструмента реализованы с использованием двухуровневого подхода к моделированию морфологии на основе конечных автоматов. В работе подробно рассматриваются особенности морфологии науканского языка, влияющие на разработку ...
Добавлено: 11 марта 2025 г.
Разработка и апробация Индекса продуктивности синтаксиса при освоении именных групп русскоговорящими детьми
Дьячкова М. Д., Секерина И. А., Дорофеева С. В., В кн.: Когнитивная наука в Москве: новые исследования. Материалы конференции 21–22 июня 2023 г.: М.: «Буки Веди», Московский институт психоанализа, 2023. С. 583–587.
В рамках настоящего проекта было положено начало разработке Индекса продуктивности синтаксиса для именных групп - нового метода для оценки грамматической сложности образцов спонтанной речи русскоязычных детей. Такой инструмент был предложен в 1990 году для англоязычных детей, однако на базе русского языка подобные методы отсутствуют, речевой профиль маленьких детей чаще оценивается субъективно. Опираясь на оригинальный Индекс, ...
Добавлено: 12 июля 2024 г.
Проект Chekhov Digital: задачи и проблемы реализации семантической разметки текстов (на примере рассказа А. П. Чехова «Смерть чиновника»)
Северина Е. М., Ларионова М. Ч., Litera 2023 № 10 С. 211–222
В статье рассматривается модель подготовки машиночитаемой (семантической) разметки текстов для проекта Chekhov Digital на примере филологической интерпретации отдельных значимых элементов рассказа А. П. Чехова «Смерть чиновника» и представления этих сведений в явном виде с опорой на стандарты цифровой публикации Text Encoding Initiative (TEI/XML). Выявлены значимые сущности для разметки корпуса текстов писателя, однако вопрос их репрезентации ...
Добавлено: 12 января 2024 г.
Ранние этапы усвоения морфосинтаксиса детьми 1-3 ЛЕТ (по данным лонгитюдных записей)
Дьячкова М. Д., Лопухина А. А., В кн.: Проблемы онтолингвистики - 2023: вариативность речевого онтогенеза.: СПб.: ООО "Издательство ВВМ", 2023. С. 55–59.
Исследование посвящено ранним этапам усвоения грамматики русского языка детьми 1-3 лет. Работа реализуется на базе лонгитюдных записей корпусов двух русскоязычных детей, созданных по протоколу CHILDES. Мы выявили следующие тенденции в раннем речевом развитии: косвенные падежи появляются в речи детей постепенно, от винительного падежа к творительному, первые глагольные формы - императив и формы первого лица. Порядок ...
Добавлено: 3 ноября 2023 г.
ВИЗУАЛИЗАЦИЯ ДАННЫХ В ЭМОЦИОНАЛЬНОМ АНАЛИЗЕ РУССКОЯЗЫЧНЫХ ИНТЕРНЕТ-ТЕКСТОВ НА ОСНОВЕ МОДЕЛИ "КУБ ЛЁВХЕЙМА"
Колмогорова А. В., Калинин А. А., В кн.: Язык и искусственный интеллект: Сборник статей по итогам конференции «Лингвистический форум 2020: Язык и искусственный интеллект».: Издательский дом ЯСК, 2023. С. 167–181.
В данной публикации рассматривается специфика и эвристика средств визуализации данных, полученных в результате применения алгоритмов анализа эмоций в тексте. Дан общий обзор применения техник визуализации для задач сентимент-анализа и анализа эмоций. Предложены варианты визуализации эмоционального представления текстов, анализируемых в рамках теоретического подхода «Куб Лёвхейма», в котором эмоция представляется в виде комбинации трех нейротрансмиттеров. Подобная модель ...
Добавлено: 31 октября 2023 г.
Обзор методов оценки сложности текстов в сфере регулирования банковской деятельности
Морковкин А. Г., Ильвовский Д. А., В кн.: ИТиС 2022: Сборник трудов 46-й междисциплинарной школы-конференции ИППИ РАН "Информационные технологии и системы 2022".: Институт проблем передачи информации им. А.А. Харкевича РАН, 2022.
Оценка сложности текстов является важной и актуальной задачей области обработки естественного языка. Например, в банковской сфере, по мнению экспертов, прослеживается тенденция к повышению сложности текстов во всех областях финансового регулирования, что усложняет их понимание даже профессионалами. Это может приводить к различным трактовкам, поэтому текст должен быть написан простым языком и быть понятным для адресатов. Но ...
Добавлено: 23 сентября 2023 г.
Building Dataset and Morpheme Segmentation Model for Russian Word Forms
Большакова Е. И., Sapin A., , in: Computational Linguistics and Intellectual Technologies: Papers from the Annual International Conference “Dialogue” (2021)Issue 20: Основной том.: -, 2021. P. 154–161.
Добавлено: 30 октября 2021 г.
Проблемы онтолингвистики - 2021: языковая система ребенка в ситуации одно- и многоязычия
СПб.: ООО "ВВМ", 2021.
В сборник вошли материалы ежегодной конференции, посвященной проблемам становления языковой системы ребенка в ситуации одно- и многоязычия. В докладах участников обсуждаются традиционные для современной онтолингвистики проблемы: освоение словарного состава языка и грамматики (словообразования, морфологии, синтаксиса), становление коммуникации и ее особенности, которые проявляются в разных ситуациях, влияние инпута на речевую деятельность детей, овладение письменной формой речи; ...
Добавлено: 5 сентября 2021 г.
Вариативность написаний в ранних детских письменных текстах
Ахапкина Я. Э., В кн.: Современная онтолингвистика: проблемы, методы, открытия.: Иваново: ЛИСТОС, 2019. С. 69–73.
Идея интуитивного освоения письма в русле действия тех же механизмов, которые обеспечивают естественное освоение устной речи на родном языке, формулировалась в работах С. Н. Цейтлин и М. В. Русаковой (Цейтлин и др. 1999, Русакова 2013). Действительно, начинающие писать дошкольники бессознательно опираются на целый ряд закономерностей, вычленяемых из устного и письменного речевого образца (инпута): "Некоторые механизмы ...
Добавлено: 28 марта 2020 г.
Современная онтолингвистика: проблемы, методы, открытия
Иваново: ЛИСТОС, 2019.
В сборник вошли материалы международной научной конференции «Современная онтолингвистика: проблемы, методы, открытия», которая прошла в Санкт-Петербурге 24–26 июня 2019 г. Авторы сборника – лингвисты, психологи, дефектологи, специалисты в области преподавания русского языка как родного и как иностранного. В докладах участников конференции прослеживаются основные направления исследований детской речи: становление грамматического строя русского языка, освоение словарного состава, ...
Добавлено: 28 марта 2020 г.
Computational Linguistics and Intellectual Technologies Papers from the Annual International Conference “Dialogue” (2019)
M.: Russian State University for the Humanitie, 2019.
Сборник включает 64 доклада международной конференции по компьютерной лингвистике и интеллектуальным технологиям «Диалог 2019», представляющих широкий спектр теоретических и прикладных исследований в области описания естественного языка, моделирования языковых процессов, создания практически применимых компьютерных лингвистических технологий. ...
Добавлено: 16 октября 2019 г.
Функции императивных форм дай/давай и их грамматикализованных вариантов в высказываниях детей
Воейкова М., Иванова К. А., В кн.: Проблемы функциональной грамматики. Предикативные категории в высказывании и целостном тексте.Т. 6: Предикативные категории в высказывании и целостном тексте.: М.: Издательский дом ЯСК, 2017. С. 308–331.
Раздел М. Д. Воейковой и К. А. Ивановой "Функции императивных форм дай / давай и их грамматикализованных вариантов в высказываниях детей и взрослых" посвящен функционированию соответствующих императивных форм от глаголов с семантикой передачи объекта. Известно, что в русском языке эти формы обладают высокой частотностью и бльшим функциональным спектром, причем пути их грамматикализации и закрепление различных ...
Добавлено: 26 октября 2018 г.
Система автоматического аннотирования текстов с помощью стохастической модели
Вознесенская Т. В., Леднов Д. А., Машинное обучение и анализ данных 2018 Т. 4 № 4 С. 266–279
Работа посвящена системе автоматического аннотирования текста, реализованной в рамках совместного проекта компании «DC – Systems» и факультета компьютерных наук НИУ ВШЭ. Построение аннотации осуществляется с помощью синтаксически согласованных словосочетаний, наиболее близких к семантике всего текста. При этом пренебрегается возможными дополнительными смыслами отдельных фрагментов текста. Качество аннотации определяется семантической близостью к исходному тексту. Задача построения аннотации разбивается ...
Добавлено: 5 октября 2018 г.
Тактики представления двух последовательных ситуаций в детском нарративе (на материале сочинений по картинке учеников 2 класса)
Ахапкина Я. Э., В кн.: Проблемы онтолингвистики - 2018: Материалы международной научной конференции 20-23 марта 2018.: СПб.: ЛИСТОС, 2018. С. 363–368.
Анализируются способы перехода от описания предшествующей ситуации активного действия к последующей ситуации статичного состояния в подготовленных письменных текстах второклассников. Выделено три группы осмыслений сюжета: обе ситуации мыслятся конкретными единичными; обе ситуации мыслятся типичными повторяющимися; конкретной мыслится только вторая (статичная) ситуация. Отмечено три типа средств, маркирующих смену ситуации: лексический контраст (днем — вечером), грамматический (видовой) контраст ...
Добавлено: 23 марта 2018 г.
Проблемы онтолингвистики - 2018: Материалы международной научной конференции 20-23 марта 2018
СПб.: ЛИСТОС, 2018.
В книгу вошли материалы международной конференции, приуроченной к юбилею основоположника Санкт-Петербургсеой школы онтолингвистики профессора С. Н. Цейтлин. Лингвисты, физиологи, педагоги и логопеды рассматривают становление грамматической системы ребенка, освоение словарного состава языка, овладение звуковой стороной речи, освоение чтения и письма, становление коммуникативной и текстовой компетенций. ...
Добавлено: 23 марта 2018 г.
Машинная лингвистика: от перевода со словарём к нелинейным динамическим системам
Волкова Л. Л., В кн.: Новые информационные технологии в автоматизированных системах: материалы шестнадцатого научно-технического семинара.: М.: Московский государственный институт электроники и математики, 2013. С. 317–328.
В статье дан краткий обзор ключевых этапов развития машинной лингвистики в разрезе анализа и синтеза текста. Выделены проблемы работы с языком, являющиеся фундаментальными ограничениями, отделяющими существующий уровень развития отрасли от качественно нового. Рассмотрены перспективные теории, предлагающие новый подход к рассмотрению языка и открывающие возможность заглянуть за барьер машинной лингвистики. ...
Добавлено: 31 января 2018 г.
Анализ грамматического частотного профиля лексем корпуса детской речи как метод изучения развития речи в норме и при первичном недоразвитии речи у дошкольников
Корнев А. Н., Балчюниене И., Воейкова М. Д. и др., Новые информационные технологии в автоматизированных системах 2016 № 19 С. 33–38
Среди разнообразных методов изучения детской речи до настоящего времени не предпринималось попыток количественного статистического анализа распределения грамматических категорий в текстах детей, как с нормой развития, так и при состояниях первичного недоразвития речи. Существует много свидетельств, что в процессе развития языка и речи ребенок начинает использовать синтаксически более сложные конструкции, включающие все более широкий круг знаменательных ...
Добавлено: 16 декабря 2017 г.
Семантические функции и особенности употребления отглагольных частиц "дай / давай"
Воейкова М. Д., Иванова К. А., Труды института русского языка им. В.В. Виноградова 2016 Т. 10 С. 44–57
Отглагольные частицы дай/давай привлекают внимание разным набором своих функций при сходных путях грамматикализации и частичной взаимозаменяемости в основном, императивном употреблении. Функциональная поляризация начинается с ранних этапов появления данных форм в речи детей и сохраняется в речи взрослых. Причина функциональной асимметрии может заключаться в различной степени соответствия между передаваемым действием и его противоположными видовыми характеристиками: прототипическое ...
Добавлено: 16 декабря 2017 г.
  • О ВЫШКЕ
  • Цифры и факты
  • Руководство и структура
  • Устойчивое развитие в НИУ ВШЭ
  • Преподаватели и сотрудники
  • Корпуса и общежития
  • Закупки
  • Обращения граждан в НИУ ВШЭ
  • Фонд целевого капитала
  • Противодействие коррупции
  • Сведения о доходах, расходах, об имуществе и обязательствах имущественного характера
  • Сведения об образовательной организации
  • Людям с ограниченными возможностями здоровья
  • Единая платежная страница
  • Работа в Вышке
  • ОБРАЗОВАНИЕ
  • Лицей
  • Довузовская подготовка
  • Олимпиады
  • Прием в бакалавриат
  • Вышка+
  • Прием в магистратуру
  • Аспирантура
  • Дополнительное образование
  • Центр развития карьеры
  • Бизнес-инкубатор ВШЭ
  • Образовательные партнерства
  • Обратная связь и взаимодействие с получателями услуг
  • НАУКА
  • Научные подразделения
  • Исследовательские проекты
  • Мониторинги
  • Диссертационные советы
  • Защиты диссертаций
  • Академическое развитие
  • Конкурсы и гранты
  • Внешние научно-информационные ресурсы
  • РЕСУРСЫ
  • Библиотека
  • Издательский дом ВШЭ
  • Книжный магазин «БукВышка»
  • Типография
  • Медиацентр
  • Журналы ВШЭ
  • Публикации
  • http://www.minobrnauki.gov.ru/
    Министерство науки и высшего образования РФ
  • https://edu.gov.ru/
    Министерство просвещения РФ
  • http://www.edu.ru
    Федеральный портал «Российское образование»
  • https://elearning.hse.ru/mooc
    Массовые открытые онлайн-курсы
  • НИУ ВШЭ1993–2026
  • Адреса и контакты
  • Условия использования материалов
  • Политика конфиденциальности
  • Правила применения рекомендательных технологий в НИУ ВШЭ
  • Карта сайта
Редактору