?
Регуляризация вероятностных тематических моделей для повышения интерпретируемости и определения числа тем
С. 676-687.
Vorontsov K. V., Potapenko A.
In book
Вып. 13(20). , М. : Изд-во РГГУ, 2014
К.В. Воронцов, Потапенко А. А., Машинное обучение и анализ данных 2013 Т. 1 № 6 С. 657-686
Probabilistic topic models discover a low-dimensional interpretable representation of text corpora
by estimating a multinomial distribution over topics for each document and a multinomial
distribution over terms for each topic. A unied family of expectation-maximization (EM) like
algorithms with smoothing, sampling, sparsing, and robustness heuristics that can be used in
any combinations is considered. The known models PLSA (probabilistic ...
Added: May 6, 2014
Vorontsov K. V., Потапенко А. А., Доклады Академии наук 2014 Т. 456 № 3 С. 268-271
Вероятностное тематическое моделирование коллекций текстовых документов
развивается в настоящее время, главным образом, в рамках байесовского подхода
и графических моделей. В данной работе предлагается альтернативный подход,
свободный от избыточных вероятностных предположений. Аддитивная регуляри зация тематических моделей (ARTM) основана на максимизации взвешенной сум мы логарифма правдоподобия и дополнительных критериев регуляризаторов.
Это упрощает комбинирование тематических моделей и построение сколь угод но сложных многоцелевых моделей. ...
Added: December 5, 2014
Vorontsov K. V., Potapenko A., Компьютерные исследования и моделирование 2012 Т. 4 № 4 С. 693-706
We propose a generalized probabilistic topic model of text corpora which can incorporate heuristics of Bayesian regularization, sampling, frequent parameters update, and robustness in any combinations. Well- known models PLSA, LDA, CVB0, SWB, and many others can be considered as special cases of the proposed broad family of models. We propose the robust PLSA model ...
Added: February 19, 2015
Vorontsov K. V., Potapenko A., Машинное обучение и анализ данных 2013 Т. 1 № 6 С. 657-686
Probabilistic topic models discover a low-dimensional interpretable representation of text corpora by estimating a multinomial distribution over topics for each document and a multinomial distribution over terms for each topic. A unied family of expectation-maximization (EM) like algorithms with smoothing, sampling, sparsing, and robustness heuristics that can be used in any combinations is considered. The ...
Added: February 19, 2015
Dubnov Y. A., Bulychev A., Информационные технологии и вычислительные системы 2022 № 4 С. 69-80
The work is devoted to the development of an entropy estimation method with “soft” randomization for restoring the parameters of probabilistic mathematical models from the available observations. Soft randomization refers to the technique of adding regularization to the information entropy functional to simplify the optimization problem and speed up learning process compared to the traditional ...
Added: June 16, 2023
Rybalka A., Корпоративные финансы 2017 Т. 11 № 3 С. 79-99
In this paper, we have estimated the probability for default in large construction companies in Russia using the classic
method for this purpose – logistic regression. Our task incorporates testing corporate governance factors and analyzing
the predictive power of the model with regularization (Lasso and Ridge). For the dependent variable, we tested four
definitions of default and then ...
Added: October 17, 2017
Sergei Koltcov, Nikolenko S. I., Olessia Koltsova et al., , in : Internet Science, Proc. of 3d conf INSCI 2016, Lecture Notes in Computer Science series. Vol. 9934.: Switzerland : Springer, 2016. P. 176-188.
Topic modeling has emerged over the last decade as a powerful tool for analyzing large text corpora, including Web-based user-generated texts. Topic stability, however, remains a concern: topic models have a very complex optimization landscape with many local maxima, and even different runs of the same model yield very different topics. Aiming to add stability ...
Added: October 7, 2016
Chetverushkin B. N., Zlotnik A.A., Russian Journal of Mathematical Physics 2017 Vol. 24 No. 3 P. 299-309
We study a multidimensional hyperbolic quasi-gasdynamic (HQGD) system of equations containing terms with a regularizing parameter $\tau>0$ and 2nd order space and time derivatives; the body force is taken into account. We transform it to the form close to the compressible Navier-Stokes system of equations. Then we derive the entropy balance equation and show that ...
Added: July 19, 2017
Sergey Nikolenko, Sergei Koltcov, Olessia Koltsova, Journal of Information Science 2017 Vol. 43 No. 1 P. 88-102
Qualitative studies, such as sociological research, opinion analysis and media studies, can benefit greatly from automated topic mining provided by topic models such as latent Dirichlet allocation (LDA). However, examples of qualitative studies that employ topic modelling as a tool are currently few and far between. In this work, we identify two important problems along ...
Added: October 7, 2016
Ducomet B., Zlotnik A., / Cornell University. Series math "arxiv.org". 2012. No. arXiv:1211.3539 [math.AP].
A brief derivation of a specific regularization for the magnetic gas dynamic system of equations is given in the case of general equations of gas state (in presence of a body force and a heat source). The entropy balance equation in two forms is also derived for the system. For a constant regularization parameter and ...
Added: January 25, 2013
Zlotnik A., Lomonosov T., Журнал вычислительной математики и математической физики 2022 Т. 62 № 12 С. 1981-2001
Изучается явная двухслойная симметричная по пространству схема на разнесенных сетках с квазигидродинамической регуляризацией для 1D баротропных систем уравнений движения газа.
Выводятся как необходимые условия, так и близкие к ним достаточные условия L²-диссипативности решений задачи Коши для ее линеаризации на постоянном решении при произвольном фоновом числе Маха M.
Применяется спектральный подход и анализируются матричные неравенства, содержащие символы симметричных ...
Added: May 14, 2022
Sirotin V., В кн. : Эконометрика: учебник. : М. : Проспект, 2015. Гл. 4. С. 72-92.
Рассматриваются виды мультиколлинеарности и ее последствия, методы диагностики мультиколлинеарности. Наряду с отбором наиболее информативных признаков и удаления дублирующих характеристик представлены методы перехода к в ортогональное признаковое пространство и регуляризации модели без изменения состава регрессоров. ...
Added: March 10, 2017
Zlotnik A., Lomonosov T., / Институт прикладной математики им. М.В. Келдыша Российской академии наук. Серия "Препринты ИПМ им. М.В. Келдыша". 2021. № 72.
Added: October 22, 2021
Zlotnik Alexander, Ducomet B., Kinetic and Related Models 2013 Vol. 6 No. 3 P. 533-543
A brief derivation of a specific regularization for the magnetic gas dynamic system of equations is given in the case of general equations of gas state (in presence of a body force and a heat source). The entropy balance equation in two forms is also derived for the system. For a constant regularization parameter and ...
Added: September 27, 2013
Protasov V., Calcolo 2019 Vol. 56 No. 2 P. 1-11
Multiple Perron eigenvectors of non-negative matrices occur in applications, where
they often become a source of trouble. A usual way to avoid it and to make the
Perron eigenvector simple is a regularization of matrix: an initial non-negative matrix
A is replaced by A + "M, where M is a strictly positive matrix and " > 0 is ...
Added: June 12, 2019
Ignatenko V., Koltsov S., Staab S. et al., Physica A: Statistical Mechanics and its Applications 2019
Topic modeling is a popular approach for clustering text documents. A variety of different types of regularization is implemented in topic modeling. In this paper, we propose a novel approach for analyzing the influence of different regularization types on results of topic modeling. Based on Renyi entropy, this approach is inspired by the concepts from ...
Added: October 31, 2019
Agaev R., Chebotarev P. Y., , in : Proceedings of The 6th International Conference on Control and Optimization with Industrial Applications. Vol. 1.: [б.и.], 2018. Ch. 1. P. 26-28.
In this paper, we propose several consensus protocols of the first and second order for networked multi-agent systems and provide explicit representations for their asymptotic states. These representations involve the eigenprojection of the Laplacian matrix of the dependency digraph.In particular, we study regularization models for the problem of coordination when the dependency digraph does not ...
Added: October 31, 2018
Koltsov S., Ignatenko V., Boukhers Z. et al., Entropy 2020 Vol. 22 No. 4 P. 1-13
Topic modeling is a popular technique for clustering large collections of text documents. A variety of different types of regularization is implemented in topic modeling. In this paper, we propose a novel approach for analyzing the influence of different regularization types on results of topic modeling. Based on Renyi entropy, this approach is inspired by ...
Added: April 1, 2020
Lapshin V. A., Каушанский В. Я., Kurbangaleev M. Z., Экономический журнал Высшей школы экономики 2015 Т. 19 № 1 С. 9-29
В работе предлагается новый непараметрический метод оценки кривой бескупонной доходности по рыночным котировкам купонных облигаций. В отличие от существующих альтернатив, предлагаемый метод обладает рядом достоинств: возможность отражения сложных форм кривой бескупонной доходности, отсутствие необходимости экспертной (ручной) подстройки баланса точности и гладкости, контроль неотрицательности мгновенных форвардных процентных ставок, учёт рыночной ликвидности облигаций, согласованность с безарбитражной моделью ...
Added: February 6, 2015
Zlotnik A., Математическое моделирование 2012 Т. 24 № 4 С. 65-79
Дан краткий подход к построению баротропной квазигазодинамической (КГД) системы уравнений с помощью специальной регуляризации по времени баротропной системы уравнений Навье-Стокса вязкого сжимаемого газа. Этот подход обобщен на случай КГД системы с общими уравнениями состояния газа, массовой силой и источником тепла. Для баротропной КГД системы с потенциальной массовой силой выведено поточечное уравнение энергетического баланса. В качестве ...
Added: June 30, 2012
Горшков А. А., Ossadtchi A., Фрадков А. Л., Информационно-управляющие системы 2017 Т. 5 № 90
Постановка проблемы: пространственное разрешение электроэнцефалографии/магнитоэнцефалографии зависит от метода решения обратной задачи, которая в силу фундаментальных физических причин является некорректно поставленной и имеет бесконечно большое количество решений. В последние несколько лет появились новые свидетельства о том, что нейрональная активность распространяется по коре в соответствии с волновым паттерном, характеризуемым некоторым направлением и скоростью распространения волны. Новые данные ...
Added: April 21, 2018
Kurbangaleev M. Z., Lapshin V. A., Smirnov S. N., Управление риском 2015 № 4 С. 59-78
Работа дополняет методику EFFAS-EBC и позволяет в форме, не зависящей от способа описания срочной структуры, инкорпорировать информацию о спредах CDS в процесс оценки кривой безрисковой доходности и спредов облигаций различных эмитентов. Это в свою очередь позволяет: 1) отказаться от предположения о плоской структуре кредитного спреда и построить его срочную структуру; 2) учесть неоднородность исходных данных ...
Added: September 28, 2015
Lapshin V. A., Vadim Ya Kaushanskiy, / Высшая школа экономики. Series FE "Financial Economics". 2014. No. 39.
We present a new nonparametric method for fitting the term structure of interest rates from bond prices. Our method is a variant of the smoothing spline approach, but within our framework we are able to determine the smoothing coefficient automatically from the data using generalized crossvalidation or maximum likelihood estimates. We present an effective numerical ...
Added: January 30, 2015
А. А. Злотник, Доклады Российской академии наук. Математика, информатика, процессы управления (ранее - Доклады Академии Наук. Математика) 2022 Т. 506 № 1 С. 89-94
Выполняется регуляризация двух типов и агрегирование системы уравнений движения многоскоростной смеси вязких несжимаемых жидкостей и строятся новые многоскоростные и односкоростные системы. Для всех них выводятся эллиптические уравнения для давления и диссипативные уравнения баланса полной энергии смеси (суммы кинетической и потенциальной энергий смеси). ...
Added: September 15, 2022