• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Глава

Моделирование семантических связей в текстах социальных сетей с помощью алгоритма LDA (на материале русскоязычного сегмента Живого Журнала)

Митрофанова О. А., Шиморина А. С.

Компьютерная обработка корпусов текстов, сформированных на основе социальных сетей, открывает широкие возможности для оперативной оценки не только общественного мнения, но и состояния русскоязычного дискурса, динамики словаря, развития внутриязыковых связей.

Цель исследования заключается в том, чтобы 1) осуществить эксперименты по моделированию тематики корпуса текстов Живого Журнала (ЖЖ) Livejournal.ru с помощью программного комплекса TopicMiner, основанного на алгоритме LDA (Latent Dirichlet Allocation), 2) определить содержательный спектр тем, отраженных в записях пользователей ЖЖ, 3) выявить и проинтерпретировать основные типы семантических связей слов внутри тем, 4) найти адекватные модели анализа полученных экспериментальных данных.

В книге

Кн. 10. СПб.: Издательство Санкт-Петербургского государственного университета, 2014.