• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • A
  • A
  • A
  • A
  • A
Обычная версия сайта
  • RU
  • EN
  • Национальный исследовательский университет «Высшая школа экономики»
  • Публикации ВШЭ
  • Статьи
  • Модификации EM-алгоритма для вероятностного тематического моделирования
  • RU
  • EN
Расширенный поиск
Высшая школа экономики
Национальный исследовательский университет
Приоритетные направления
  • бизнес-информатика
  • государственное и муниципальное управление
  • гуманитарные науки
  • инженерные науки
  • компьютерно-математическое
  • математика
  • менеджмент
  • право
  • социология
  • экономика
по году
  • 2027
  • 2026
  • 2025
  • 2024
  • 2023
  • 2022
  • 2021
  • 2020
  • 2019
  • 2018
  • 2017
  • 2016
  • 2015
  • 2014
  • 2013
  • 2012
  • 2011
  • 2010
  • 2009
  • 2008
  • 2007
  • 2006
  • 2005
  • 2004
  • 2003
  • 2002
  • 2001
  • 2000
  • 1999
  • 1998
  • 1997
  • 1996
  • 1995
  • 1994
  • 1993
  • 1992
  • 1991
  • 1990
  • 1989
  • 1988
  • 1987
  • 1986
  • 1985
  • 1984
  • 1983
  • 1982
  • 1981
  • 1980
  • 1979
  • 1978
  • 1977
  • 1976
  • 1975
  • 1974
  • 1973
  • 1972
  • 1971
  • 1970
  • 1969
  • 1968
  • 1967
  • 1966
  • 1965
  • 1964
  • 1963
  • 1958
  • еще
Тематика
Новости
23 июня 2026 г.
<a><a><a>НИУ ВШЭ и Positive Technologies наградили проекты молодых ученых по оценке последствий кибератак
Молодые исследователи из ведущих вузов страны представили проекты по прогнозированию и оценке последствий кибератак. Защита идей прошла 22 июня в Москве в рамках междисциплинарного научного конкурса, организованного Институтом мировой военной экономики и стратегии НИУ ВШЭ и Positive Technologies. Победителями стали команды Военно-космической академии имени Можайского, НИУ ВШЭ и университета «Сириус» — они разделят грантовый фонд в три миллиона рублей и продолжат свои разработки под руководством научных наставников.
23 июня 2026 г.
Дрожь земли: ученые ВШЭ научились отслеживать опасные подземные вибрации в реальном времени
Исследователи из МИЭМ ВШЭ и ИПКОН РАН разработали новую математическую модель мониторинга, которая позволяет фиксировать источник опасных подземных вибраций в реальном времени. Технология поможет снизить риск повреждения зданий, дорог и другой инфраструктуры рядом с карьерами и шахтами. Работа ученых опубликована в журнале «Горная промышленность».
22 июня 2026 г.
Эффект Вышки: статьи в журналах первого квартиля и PhD в Университете Сиднея
Стефен Содоке, магистрант ОП «Население и развитие» Института демографии имени А.Г. Вишневского НИУ ВШЭ, победил в прошлом году в конкурсе научно-исследовательских работ студентов (НИРС). В 2026-м, уже в статусе выпускника Высшей школы экономики, он опубликовал две статьи в журналах первого квартиля и получил PhD в Университете Сиднея. Об исследовании Стефена и роли Вышки в его академической карьере — в нашем материале.

 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!

Публикации
  • Книги
  • Статьи
  • Главы в книгах
  • Препринты
  • Верификация публикаций
  • Расширенный поиск
  • Правила использования материалов
  • Наука в ВШЭ

?

Модификации EM-алгоритма для вероятностного тематического моделирования

Машинное обучение и анализ данных. 2013. Т. 1. № 6. С. 657–686.
Воронцов К. В., Потапенко А. А.

Вероятностная тематическая модель (ВТМ) строит интерпретируемое представление коллекции текстовых документов,     описывая каждый документ дискретным распределением на множестве тем, каждую тему - дискретным распределением на множестве терминов. Рассматривается обобщённый EM-алгоритм с эвристиками сглаживания, сэмплирования, робастности и разреживания, позволяющий при различных сочетаниях этих эвристик получать как известные тематические модели PLSA, LDA, SWB, так и новые. Предлагается упрощённый робастный алгоритм, который не требует ни дополнительных вычислительных затрат, ни хранения матрицы параметров шума, и хорошо сочетается с эвристикой разреживания. В экспериментах на двух коллекциях научных публикаций, англоязычной и русскоязычной, подбираются оптимальные сочетания стратегий разреживания и других эвристик. Показывается, что робастная модель без сглаживания позволяет разреживать искомые распределения на 99\% без ухудшения качества (перплексии) модели.

Приоритетные направления: компьютерно-математическое
Язык: русский
Полный текст
Ключевые слова: EM-алгоритмLDAEM-algorithmлатентное размещение Дирихлеbayesian inferenceбайесовский выводвероятностный латентный семантический анализPLSAвероятностное тематическое моделированиеprobabilistic topic modeling
Похожие публикации
Growth in noncommutative algebras and entropy in derived categories
Пионтковский Д. И., / Series arXiv "math". 2026.
Добавлено: 23 июня 2026 г.
Multilinear nilalgebras and the Jacobian theorem
Пионтковский Д. И., / Series arXiv "math". 2025.
Добавлено: 23 июня 2026 г.
ML-based Fast Simulation of FARICH Responses
Шипилов Ф. А., Barnyakov A., Ivanov A. и др., / Series Physics "arxiv.org". 2026.
Добавлено: 19 мая 2026 г.
Natural hazard database from Internet publications: text mining with a large language model
Деркачева А. А., Сакиркина М. А., Краев Г. Н. и др., /. 2026.
Добавлено: 28 апреля 2026 г.
Algorithmic overlaps as thermodynamic variables: from local to cluster Monte Carlo dynamics in critical phenomena
Пиле Я. Э., Deng Y., Щур Л. Н., / Series arXiv "math". 2026. No. 2604.10254.
Добавлено: 20 апреля 2026 г.
Using predefined vector systems to speed up neural network multimillion class classification
Gabdullin N., Андросов И. А., / Series Computer Science "arxiv.org". 2026.
Добавлено: 2 апреля 2026 г.
Iterative Ricci-Foster Curvature Flow with GMM-Based Edge Pruning: A Novel Approach to Community Detection
Сорокин К. С., Бекетов М. Е., Онучин А. и др., / arxiv.org. Серия cs.SI "Social and Information Networks ". 2025.
Обнаружение сообществ в сложных сетях — фундаментальная проблема, открытая для новых подходов в различных научных областях. Мы представляем новый метод обнаружения сообществ, основанный на потоке Риччи на графах. Наша техника итеративно обновляет веса ребер (их метрические длины) в соответствии с их (комбинаторной) версией кривизны Риччи Фостера, вычисленной на основе эффективного расстояния сопротивления между узлами. Известно, ...
Добавлено: 15 января 2026 г.
Implementing Transport Coding in OMNeT++ for Message Delay Reduction
Петрованов И. С., Сергеев А. В., / Series Computer Science "arxiv.org". 2025. No. 2512.18332.
Добавлено: 24 декабря 2025 г.
Hessian-based lightweight neural network for brain vessel segmentation on a minimal training dataset
Меньшиков И. А., Бернадотт А. К., Елфимов Н. С., / Series arXie "Statistical mechanics". 2025.
Добавлено: 1 декабря 2025 г.
Determining the boundary of dynamical chaos in the generalized Chirikov map via machine learning
Чернышов Д. П., Сатанин А. М., Щур Л. Н., / Series arXiv "math". 2025.
Добавлено: 21 ноября 2025 г.
Эффективный алгоритм торговли на фондовом рынке: ретроспективный анализ, основанный на данных по S&P-500.
Рубчинский А. А., Чубарова Д. А., / Series WP7 "Математические методы анализа решений в экономике, бизнесе и политике". 2025. No. WP7/2025/01.
Добавлено: 9 ноября 2025 г.
Using topic modeling for communities clusterization in the VKontakte social network
Горшков С. С., Ilyushin E., Chernysheva A. и др., International Journal of Open Information Technologies 2021 Vol. 9 No. 5 P. 12–17
Добавлено: 25 декабря 2024 г.
Effectiveness of ELMo embeddings, and semantic models in predicting review helpfulness
Malik M. S., Nawaz A., Jamjoom M. M. и др., Intelligent Data Analysis 2024 Vol. 28 No. 4 P. 1045–1065
Добавлено: 26 февраля 2024 г.
Инновационный подход к поиску информации на примере патентного анализа плана импортозамещения
Милкова М. А., Экономическая наука современной России 2020 № 1 С. 143–157
В настоящее время процесс накопления информации настолько стремителен, что концепция привычного итерационного поиска требует пересмотра. К методам поиска необходимо предъявлять повышенные требования, находясь в мире, перенасыщенном информацией, чтобы всесторонне охватить и проанализировать исследуемую проблему. Инновационный подход к поиску должен гибко учитывать большой объем уже накопленных знаний и априорные требования к результатам. Результаты, в свою очередь, ...
Добавлено: 29 июня 2023 г.
Do topics make a metaphor? Topic modeling for metaphor identification and analysis in Russian.
Бадрызлова Ю. Г., Nikiforova A., Ляшевская О. Н., , in: Analysis of Images, Social Networks and Texts: 9th International Conference, AIST 2020, Skolkovo, Moscow, Russia, October 15–16, 2020, Revised Selected PapersVol. 12602.: Springer, 2021. P. 69–81.
Добавлено: 7 октября 2020 г.
Topic Modelling of the Russian Corpus of Pikabu Posts: Author-Topic Distribution and Topic Labelling
Mitrofanova O., Sampetova V., Mamaev I. и др., , in: Information Society: Education, Science, Culture, and Modern Technologies. (Proceedings of XXIII International Joint Conference «Internet and Modern Society», IMS-2020, St. Petersburg, 17 - 20 June 2020).: CEUR Workshop Proceedings, 2020. P. 101–116.
Добавлено: 30 сентября 2020 г.
Renormalization Analysis of Topic Models
Koltcov Sergei, Игнатенко В. В., Entropy 2020 Vol. 22 No. 5 P. 1–23
Добавлено: 18 мая 2020 г.
Analyzing the Influence of Hyper-parameters and Regularizers of Topic Modeling in Terms of Renyi entropy
Кольцов С. Н., Игнатенко В. В., Boukhers Z. и др., Entropy 2020 Vol. 22 No. 4 P. 1–13
Добавлено: 1 апреля 2020 г.
Renormalization approach to the task of determining the number of topics in topic modeling
Кольцов С. Н., Игнатенко В. В., , in: Intelligent Computing: SAI 2020: Volume 1* 1. Vol. 1228.: Switzerland: Springer, 2020. P. 234–247.
Добавлено: 11 ноября 2019 г.
Processing and Analysis of Russian Strategic Planning Programs
Алексейчук Н. Н., Саркисян В. В., Emelyanov A. и др., , in: Digital Transformation and Global Society. Fourth International Conference, DTGS 2019, St. Petersburg, Russia, June 19–21, 2019, Revised Selected Papers.: Springer, 2019. P. 68–81.
Добавлено: 30 октября 2019 г.
Estimating Topic Modeling Performance with Sharma–Mittal Entropy
Кольцов С. Н., Игнатенко В. В., Кольцова Е. Ю., Entropy 2019 Vol. 21 No. 7 P. 1–29
Добавлено: 5 июля 2019 г.
The Topics Dynamics in Knowledge Management Research
Зеленков Ю. А., , in: Knowledge Management in Organizations. 14th International Conference, KMO 2019, Zamora, Spain, July 15–18, 2019, ProceedingsVol. 1027.: Switzerland: Springer, 2019. P. 324–335.
Добавлено: 14 июня 2019 г.
Fractal approach for determining the optimal number of topics in the field of topic modeling
Игнатенко В. В., Sergei Koltcov, Staab S. и др., Journal of Physics: Conference Series 2019 Vol. 1163 No. 1 P. 1–6
Добавлено: 30 ноября 2018 г.
Doubly Semi-Implicit Variational Inference
Молчанов Д. А., Харитонов В. Д., Artem Sobolev и др., / Series arxiv.org "stat.ML". 2018.
Добавлено: 21 октября 2018 г.
  • О ВЫШКЕ
  • Цифры и факты
  • Руководство и структура
  • Устойчивое развитие в НИУ ВШЭ
  • Преподаватели и сотрудники
  • Корпуса и общежития
  • Закупки
  • Обращения граждан в НИУ ВШЭ
  • Фонд целевого капитала
  • Противодействие коррупции
  • Сведения о доходах, расходах, об имуществе и обязательствах имущественного характера
  • Сведения об образовательной организации
  • Людям с ограниченными возможностями здоровья
  • Единая платежная страница
  • Работа в Вышке
  • ОБРАЗОВАНИЕ
  • Лицей
  • Довузовская подготовка
  • Олимпиады
  • Прием в бакалавриат
  • Вышка+
  • Прием в магистратуру
  • Аспирантура
  • Дополнительное образование
  • Центр развития карьеры
  • Бизнес-инкубатор ВШЭ
  • Образовательные партнерства
  • Обратная связь и взаимодействие с получателями услуг
  • НАУКА
  • Научные подразделения
  • Исследовательские проекты
  • Мониторинги
  • Диссертационные советы
  • Защиты диссертаций
  • Академическое развитие
  • Конкурсы и гранты
  • Внешние научно-информационные ресурсы
  • РЕСУРСЫ
  • Библиотека
  • Издательский дом ВШЭ
  • Книжный магазин «БукВышка»
  • Типография
  • Медиацентр
  • Журналы ВШЭ
  • Публикации
  • http://www.minobrnauki.gov.ru/
    Министерство науки и высшего образования РФ
  • https://edu.gov.ru/
    Министерство просвещения РФ
  • http://www.edu.ru
    Федеральный портал «Российское образование»
  • https://elearning.hse.ru/mooc
    Массовые открытые онлайн-курсы
  • НИУ ВШЭ1993–2026
  • Адреса и контакты
  • Условия использования материалов
  • Политика конфиденциальности
  • Правила применения рекомендательных технологий в НИУ ВШЭ
  • Карта сайта
Редактору