• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Статья

Аддитивная регуляризация тематических моделей

Доклады Академии наук. 2014. Т. 456. № 3. С. 268-271.
Воронцов К. В., Потапенко А. А.

Вероятностное тематическое моделирование коллекций текстовых документов
развивается в настоящее время, главным образом, в рамках байесовского подхода
и графических моделей. В данной работе предлагается альтернативный подход,
свободный от избыточных вероятностных предположений. Аддитивная регуляри-
зация тематических моделей (ARTM) основана на максимизации взвешенной сум-
мы логарифма правдоподобия и дополнительных критериев  регуляризаторов.
Это упрощает комбинирование тематических моделей и построение сколь угод-
но сложных многоцелевых моделей. Многие известные модели рассматриваются
как регуляризаторы в терминах ARTM. В экспериментах на реальных данных
исследуются комбинации регуляризаторов сглаживания, разреживания и декор-
реляции. Вместе они позволяют существенно улучшить критерии разреженности,
когерентности, чистоты и