?
Моделирование семантических связей в текстах социальных сетей с помощью алгоритма LDA (на материале русскоязычного сегмента Живого Журнала)
Компьютерная обработка корпусов текстов, сформированных на основе социальных сетей, открывает широкие возможности для оперативной оценки не только общественного мнения, но и состояния русскоязычного дискурса, динамики словаря, развития внутриязыковых связей.
Цель исследования заключается в том, чтобы 1) осуществить эксперименты по моделированию тематики корпуса текстов Живого Журнала (ЖЖ) Livejournal.ru с помощью программного комплекса TopicMiner, основанного на алгоритме LDA (Latent Dirichlet Allocation), 2) определить содержательный спектр тем, отраженных в записях пользователей ЖЖ, 3) выявить и проинтерпретировать основные типы семантических связей слов внутри тем, 4) найти адекватные модели анализа полученных экспериментальных данных.