• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Статья

АВТОМАТИЧЕСКАЯ КЛАССИФИКАЦИЯ ТЕКСТОВ С ИСПОЛЬЗОВАНИЕМ СЕМАНТИКО-СИНТАКСИЧЕСКИХ СВЯЗЕЙ СЛОВ

Лебедев И. С., Спивак А., Лапшин С.

Аннотация. Предложен метод повышения показателей качества автоматической классификации текстов за счет использования информации о семантико-синтаксических связях между словами. Анализ графа семантико-синтаксического разбора текста позволяет выделить множество признаков, которые могут быть использованы как для обучения отдельного классификатора, так и добавлены к статистическим признакам и использоваться при обучении совместно. Разработан классификатор, реализующий рассматриваемую идею. Эксперимент, поставленный на коротких научных текстах, показал снижение числа ошибок классификации на 12,15 % по сравнению с классификатором, обученным на статистических признаках.