?
Анализ ошибок морфологического анализатора MyStem при работе с записями детской речи
Одно из условий эффективной работы автоматических морфологических анализаторов — это корректное распознавание незнакомых слов и успешное снятие морфологической омонимии. В настоящей работе оценивались результаты автоматиче- ской обработки расшифровок спонтанной детской речи с помощью морфологического анализатора MyStem. Материалами для исследования послужили лонгитюдные записи спонтанной речи двух детей-билингвов и их родителей, созданные по протоколу корпу- са CHILDES. Общая длина записей составила 956 минут и 420 минут для каждого ребен- ка соответственно. В анализ вошли 12 828 строк, размеченных парсером. В результате проведенного исследования нам удалось определить частоту встречаемости случаев с морфологической неоднозначностью и с ошибками морфологического анализатора, а также предложить типологию таких ошибок и направления для возможного усовер- шенствования работы парсера MyStem.