?
ВИЗУАЛЬНЫЙ АНАЛИЗ КЛАСТЕРНЫХ СТРУКТУР В МНОГОМЕРНЫХ ОБЪЕМАХ ТЕКСТОВОЙ ИНФОРМАЦИИ
Работа рассматривает вопросы визуального анализа кластерных структур в многомерных
объемах текстовой информации. Для анализа кластерных структур в многомерном объеме
текстовых данных используются технологии построения упругих карт, представляющие собой
методы отображения точек исходного многомерного пространства на вложенные в это
пространство многообразия меньшей размерности. Варьируя поверхность упругой карты за счет
последовательного уменьшения коэффициентов упругости, можно добиться лучшей
аппроксимации картой многомерного облака данных. Применение технологий построения упругих
карт для решения задач кластерного анализа не предполагает никакой априорной информации об
изучаемых данных и не зависит от их природы, происхождения и т.п. Схожими свойствами
обладает близкий по идеологии вероятностный подход к снижению размерности t-SNE. Данная
работа содержит описание результатов построения упругих карт и применения подхода t-SNE для
визуального анализа кластерных структур в многомерных объемах текстовой информации. Для
упругих карт подробно описан и проиллюстрирован прием «квази-зум», позволяющий
существенно улучшить результаты в области сгущения точек изучаемого многомерного
пространства. Для обоих подходов (построение упругих карт и t-SNE) показана их
работоспособность и применимость для решения задач кластеризации терминов естественного
языка.