?
Морфосинтаксическая разметка текста на китайском языке с помощью статистических анализаторов: методика, оценка качества.
Данная работа посвящена критериям выделения морфосинтаксических категорий в китайском языке и их моделированию для автоматической частеречной разметки текста. В работе приведен краткий обзор основных критериев выделения частей речи в современном китайском языке, их оценка с точки зрения задач автоматической обработки текста, в частности, с точки зрения частеречной разметки текста и использования статистических моделей. С помощью доступных нам статистических анализаторов был проведен эксперимент по разметке текста на китайском языке с целью оценки качества и соотношения их с постулируемыми в теоретических грамматиках категориями. Кроме того, при анализе полученных результатов были выведены основные принципы оценки инструментария морфоанализаторов.