• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Глава

Использование ресурсов Интернета для построения таксономии

С. 36-48.

В работе предложен двухшаговый подход к построению предметных таксономий на русском языке. На первом шаге строятся высокие уровни таксономии на основе паспортов специальностей ВАК. На втором шаге таксономические темы последовательно достраиваются новыми темами, извлеченными  и отфильтрованными из дерева категорий и статей русского сегмента Википедии. Во всех расчетах используется мера сходства между строкой и текстом, основанная на аппарате аннотированных суффиксных деревьев. 

В книге

Под науч. редакцией: Д. И. Игнатов, М. Ю. Хачай, О. Баринова М.: Национальный открытый университет «ИНТУИТ», 2013.