?
Морфологический гессер как инструмент анализа полевых данных: опыт работы с науканским языком
В статье представлено описание разработки и оценки двух инструментов автоматического морфологического анализа для науканского языка (< юпикские < эскимосские < эскимосско-алеутские): морфологического анализатора со словарем и морфологического гессера без словаря. Оба инструмента реализованы с использованием двухуровневого подхода к моделированию морфологии на основе конечных автоматов. В работе подробно рассматриваются особенности морфологии науканского языка, влияющие на разработку автоматических инструментов анализа, включая богатое словоизменение и словообразование, омонимию морфологических показателей и сложные морфонологические процессы. На материале корпуса устных текстов, записанных в 2022–2023 годах, проводится оценка эффективности работы обоих инструментов. Особое внимание уделяется проблеме сверхгенерации при работе морфологического гессера и способам её решения через разделение анализа по частям речи. Результаты исследования показывают, что при работе с полевыми данными использование гессера может быть более эффективным, несмотря на известные ограничения