?
Использование ресурсов Интернета для построения таксономии
С. 36-48.
Артемова Е. Л., Миркин Б. Г.
В работе предложен двухшаговый подход к построению предметных таксономий на русском языке. На первом шаге строятся высокие уровни таксономии на основе паспортов специальностей ВАК. На втором шаге таксономические темы последовательно достраиваются новыми темами, извлеченными и отфильтрованными из дерева категорий и статей русского сегмента Википедии. Во всех расчетах используется мера сходства между строкой и текстом, основанная на аппарате аннотированных суффиксных деревьев.
Язык:
русский
В книге
М. : Национальный открытый университет «ИНТУИТ», 2013