Регуляризация вероятностных тематических моделей для повышения интерпретируемости и определения числа тем

К. В. Воронцов; А. А. Потапенко

Publications

?

Регуляризация вероятностных тематических моделей для повышения интерпретируемости и определения числа тем

С. 676–687.

Vorontsov K. V., Potapenko A.

Language: Russian

Text on another site

Keywords: регуляризация латентное размещение Дирихле вероятностная тематическая модель вероятностный латентный семантический анализ

In book

Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной Международной конференции «Диалог» (Бекасово, 4 — 8 июня 2014 г.)

Вып. 13(20). , М.: Изд-во РГГУ, 2014.

Модификации EM-алгоритма для вероятностного тематического моделирования

К.В. Воронцов, Потапенко А. А., Машинное обучение и анализ данных 2013 Т. 1 № 6 С. 657–686

Probabilistic topic models discover a low-dimensional interpretable representation of text corpora by estimating a multinomial distribution over topics for each document and a multinomial distribution over terms for each topic. A unied family of expectation-maximization (EM) like algorithms with smoothing, sampling, sparsing, and robustness heuristics that can be used in any combinations is considered. The known models PLSA (probabilistic ...

Added: May 6, 2014

Аддитивная регуляризация тематических моделей

Vorontsov K. V., Потапенко А. А., Доклады Академии наук 2014 Т. 456 № 3 С. 268–271

Вероятностное тематическое моделирование коллекций текстовых документов развивается в настоящее время, главным образом, в рамках байесовского подхода и графических моделей. В данной работе предлагается альтернативный подход, свободный от избыточных вероятностных предположений. Аддитивная регуляри зация тематических моделей (ARTM) основана на максимизации взвешенной сум мы логарифма правдоподобия и дополнительных критериев регуляризаторов. Это упрощает комбинирование тематических моделей и построение сколь угод но сложных многоцелевых моделей. ...

Added: December 5, 2014

Регуляризация, робастность и разреженность вероятностных тематических моделей

Vorontsov K. V., Potapenko A., Компьютерные исследования и моделирование 2012 Т. 4 № 4 С. 693–706

We propose a generalized probabilistic topic model of text corpora which can incorporate heuristics of Bayesian regularization, sampling, frequent parameters update, and robustness in any combinations. Well- known models PLSA, LDA, CVB0, SWB, and many others can be considered as special cases of the proposed broad family of models. We propose the robust PLSA model ...

Added: February 19, 2015

Модификации EM-алгоритма для вероятностного тематического моделирования

Vorontsov K. V., Potapenko A., Машинное обучение и анализ данных 2013 Т. 1 № 6 С. 657–686

Added: February 19, 2015

Множественная линейная модель регрессии в условиях мультиколлинеарности

Sirotin V., В кн.: Эконометрика: учебник. М.: Проспект, 2015. Гл. 4 С. 72–92.

Рассматриваются виды мультиколлинеарности и ее последствия, методы диагностики мультиколлинеарности. Наряду с отбором наиболее информативных признаков и удаления дублирующих характеристик представлены методы перехода к в ортогональное признаковое пространство и регуляризации модели без изменения состава регрессоров. ...

Added: March 10, 2017

On a regularization of the magnetic gas dynamics system of equations

Zlotnik Alexander, Ducomet B., Kinetic and Related Models 2013 Vol. 6 No. 3 P. 533–543

A brief derivation of a specific regularization for the magnetic gas dynamic system of equations is given in the case of general equations of gas state (in presence of a body force and a heat source). The entropy balance equation in two forms is also derived for the system. For a constant regularization parameter and ...

Added: September 27, 2013

Моделирование вероятности дефолта в строительном секторе: факторы корпоративного построения

Rybalka A., Корпоративные финансы 2017 Т. 11 № 3 С. 79–99

In this paper, we have estimated the probability for default in large construction companies in Russia using the classic method for this purpose – logistic regression. Our task incorporates testing corporate governance factors and analyzing the predictive power of the model with regularization (Lasso and Ridge). For the dependent variable, we tested four definitions of default and then ...

Added: October 17, 2017

On some properties of multidimensional hyperbolic quasi-gasdynamic systems of equations

Chetverushkin B. N., Zlotnik A.A., Russian Journal of Mathematical Physics 2017 Vol. 24 No. 3 P. 299–309

We study a multidimensional hyperbolic quasi-gasdynamic (HQGD) system of equations containing terms with a regularizing parameter $\tau>0$ and 2nd order space and time derivatives; the body force is taken into account. We transform it to the form close to the compressible Navier-Stokes system of equations. Then we derive the entropy balance equation and show that ...

Added: July 19, 2017

Численное решение обратной задачи для уравнения гиперболической теплопроводности с малым параметром

Akindinov G., Матюхин В. В., Криворотько О. И., Компьютерные исследования и моделирование 2024 Т. 15 № 2 С. 245–258

В данной работе приведен алгоритм численного решения обратной начально-краевой задачи для гиперболического уравнения с малым параметром перед второй производной по времени, которая состоит в нахождении начального распределения по заданному конечному. Данный алгоритм позволяет для заданной наперед точности получить решение задачи (в допустимых пределах точности). Данный алгоритм позволяет избежать сложностей, аналогичных случаю с уравнением теплопроводности с ...

Added: October 24, 2024

On a regularization of the magnetic gas dynamics system of equations

Ducomet B., Zlotnik A., / Series math "arxiv.org". 2012. No. arXiv:1211.3539 [math.AP].

Added: January 25, 2013

A Nonparametric Method For Term Structure Fitting With Automatic Smoothing

Lapshin V. A., Vadim Ya Kaushanskiy, / NRU Higher School of Economics. Series FE "Financial Economics". 2014. No. 39.

We present a new nonparametric method for fitting the term structure of interest rates from bond prices. Our method is a variant of the smoothing spline approach, but within our framework we are able to determine the smoothing coefficient automatically from the data using generalized crossvalidation or maximum likelihood estimates. We present an effective numerical ...

Added: January 30, 2015

L²-диссипативность линеаризованной явной схемы на разнесенных сетках для уравнений 1D баротропной газовой динамики с регуляризацией

Zlotnik A., Lomonosov T., Журнал вычислительной математики и математической физики 2022 Т. 62 № 12 С. 1981–2001

Изучается явная двухслойная симметричная по пространству схема на разнесенных сетках с квазигидродинамической регуляризацией для 1D баротропных систем уравнений движения газа. Выводятся как необходимые условия, так и близкие к ним достаточные условия L²-диссипативности решений задачи Коши для ее линеаризации на постоянном решении при произвольном фоновом числе Маха M. Применяется спектральный подход и анализируются матричные неравенства, содержащие символы симметричных ...

Added: May 14, 2022

Приближенное оценивание с помощью ускоренного метода наибольшей энтропии. Часть 1. постановка задачи и реализация для задачи регрессии

Dubnov Y. A., Bulychev A., Информационные технологии и вычислительные системы 2022 № 4 С. 69–80

The work is devoted to the development of an entropy estimation method with “soft” randomization for restoring the parameters of probabilistic mathematical models from the available observations. Soft randomization refers to the technique of adding regularization to the information entropy functional to simplify the optimization problem and speed up learning process compared to the traditional ...

Added: June 16, 2023

О L^2-диссипативности линеаризованной разностной схемы на разнесенных сетках с квазигидродинамической регуляризацией для 1D баротропных уравнений движения газа

Zlotnik A., Lomonosov T., / Институт прикладной математики им. М.В. Келдыша Российской академии наук. Серия "Препринты ИПМ им. М.В. Келдыша". 2021. № 72.

Added: October 22, 2021

How to make the Perron eigenvector simple

Protasov V., Calcolo 2019 Vol. 56 No. 2 P. 1–11

Multiple Perron eigenvectors of non-negative matrices occur in applications, where they often become a source of trouble. A usual way to avoid it and to make the Perron eigenvector simple is a regularization of matrix: an initial non-negative matrix A is replaced by A + "M, where M is a strictly positive matrix and " > 0 is ...

Added: June 12, 2019

Analyzing the Influence of Hyper-parameters and Regularizers of Topic modeling in Terms of Renyi Entropy

Ignatenko V., Koltsov S., Staab S. et al., Physica A: Statistical Mechanics and its Applications 2019

Topic modeling is a popular approach for clustering text documents. A variety of different types of regularization is implemented in topic modeling. In this paper, we propose a novel approach for analyzing the influence of different regularization types on results of topic modeling. Based on Renyi entropy, this approach is inspired by the concepts from ...

Added: October 31, 2019

TWO MODELS OF LATENT CONSENSUS IN MULTI-AGENT SYSTEMS

Agaev R., Chebotarev P. Y., , in: Proceedings of The 6th International Conference on Control and Optimization with Industrial ApplicationsVol. 1. [б.и.], 2018. Ch. 1 P. 26–28.

In this paper, we propose several consensus protocols of the first and second order for networked multi-agent systems and provide explicit representations for their asymptotic states. These representations involve the eigenprojection of the Laplacian matrix of the dependency digraph.In particular, we study regularization models for the problem of coordination when the dependency digraph does not ...

Added: October 31, 2018

Analyzing the Influence of Hyper-parameters and Regularizers of Topic Modeling in Terms of Renyi entropy

Koltsov S., Ignatenko V., Boukhers Z. et al., Entropy 2020 Vol. 22 No. 4 P. 1–13

Topic modeling is a popular technique for clustering large collections of text documents. A variety of different types of regularization is implemented in topic modeling. In this paper, we propose a novel approach for analyzing the influence of different regularization types on results of topic modeling. Based on Renyi entropy, this approach is inspired by ...

Added: April 1, 2020

Оценка кривой бескупонной доходности на российском рынке облигаций

Lapshin V. A., Каушанский В. Я., Kurbangaleev M. Z., Экономический журнал Высшей школы экономики 2015 Т. 19 № 1 С. 9–29

В работе предлагается новый непараметрический метод оценки кривой бескупонной доходности по рыночным котировкам купонных облигаций. В отличие от существующих альтернатив, предлагаемый метод обладает рядом достоинств: возможность отражения сложных форм кривой бескупонной доходности, отсутствие необходимости экспертной (ручной) подстройки баланса точности и гладкости, контроль неотрицательности мгновенных форвардных процентных ставок, учёт рыночной ликвидности облигаций, согласованность с безарбитражной моделью ...

Added: February 6, 2015

О построении квазигазодинамических систем уравнений и баротропной системе с потенциальной массовой силой

Zlotnik A., Математическое моделирование 2012 Т. 24 № 4 С. 65–79

Дан краткий подход к построению баротропной квазигазодинамической (КГД) системы уравнений с помощью специальной регуляризации по времени баротропной системы уравнений Навье-Стокса вязкого сжимаемого газа. Этот подход обобщен на случай КГД системы с общими уравнениями состояния газа, массовой силой и источником тепла. Для баротропной КГД системы с потенциальной массовой силой выведено поточечное уравнение энергетического баланса. В качестве ...

Added: June 30, 2012

Регуляризация обратной задачи ЭЭГ/МЭГ локальным кортикальным волновым паттерном

Горшков А. А., Ossadtchi A., Фрадков А. Л., Информационно-управляющие системы 2017 Т. 5 № 90

Постановка проблемы: пространственное разрешение электроэнцефалографии/магнитоэнцефалографии зависит от метода решения обратной задачи, которая в силу фундаментальных физических причин является некорректно поставленной и имеет бесконечно большое количество решений. В последние несколько лет появились новые свидетельства о том, что нейрональная активность распространяется по коре в соответствии с волновым паттерном, характеризуемым некоторым направлением и скоростью распространения волны. Новые данные ...

Added: April 21, 2018

Методология оценки срочной структуры безрисковых процентных ставок по котировкам облигаций и CDS различных эмитентов

Kurbangaleev M. Z., Lapshin V. A., Smirnov S. N., Управление риском 2015 № 4 С. 59–78

Работа дополняет методику EFFAS-EBC и позволяет в форме, не зависящей от способа описания срочной структуры, инкорпорировать информацию о спредах CDS в процесс оценки кривой безрисковой доходности и спредов облигаций различных эмитентов. Это в свою очередь позволяет: 1) отказаться от предположения о плоской структуре кредитного спреда и построить его срочную структуру; 2) учесть неоднородность исходных данных ...

Added: September 28, 2015

Методы регуляции многоагентных систем для образовательной среды и ранжирования web-страниц

Агаев Р. П., Никифоров С. В., В кн.: Актуальные проблемы управления: Маркетинг и менеджмент в образовании.III Сперанские чтения. Изд-во РГГУ, 2016. Гл. 1 С. 216–223.

The models of characteristics matching for classes of multi-agent control systems with a disjoint structure of communications are considered. The regularization methods used both for multi-agent systems and for ranking web pages are investigated. ...

Added: October 31, 2018

О построении регуляризованных уравнений движения смеси вязких несжимаемых жидкостей

А. А. Злотник, Доклады Российской академии наук. Математика, информатика, процессы управления (ранее - Доклады Академии Наук. Математика) 2022 Т. 506 № 1 С. 89–94

Выполняется регуляризация двух типов и агрегирование системы уравнений движения многоскоростной смеси вязких несжимаемых жидкостей и строятся новые многоскоростные и односкоростные системы. Для всех них выводятся эллиптические уравнения для давления и диссипативные уравнения баланса полной энергии смеси (суммы кинетической и потенциальной энергий смеси). ...

Added: September 15, 2022