• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Статья

Сегментные правила в автоматическом парсере корпуса хакасского языка

Дыбо А. В., Крылов Ф., Мальцева В., Шеймович А. В.

В статье приводится описание фрагмента алгоритма работы автоматического парсера для литературного хакасского языка. Парсер осуществляет анализ «через синтез», т. е. путем многократных прямых и обратных проходов с проверкой гипотез. В статье излагается, как происходит перевод морфонологической записи словоформы в орфографическую. Так как хакасский литературный язык слабо нормирован, и не все особенности его морфонологии достаточно полно отражены в существующих грамматиках, для некоторых шагов алгоритма мы выводим правила на основе данных корпуса текстов и собранных нами материалов по хакасским диалектам.