A Method of Accounting Bigrams in Topic Models

M. Nokel; N. V. Loukachevitch

Публикации

?

A Method of Accounting Bigrams in Topic Models

P. 1-9.

Нокель М. А., Лукашевич Н. В.

Язык: английский

Текст на другом сайте

Ключевые слова: perplexity Topic Models bigrams topic coherence

В книге

NAACL HLT 2015 11th Workshop on Multiword Expressions MWE 2014

NY : Association for Computational Linguistics, 2015

Topic Models: Accounting Component Structure of Bigrams

Нокель М. А., Лукашевич Н. В., , in : Proceedings of the 20th Nordic Conference of Computational Linguistics (NODALIDA 2015). : Linköping : Linköping University Electronic Press, 2015. P. 145-152.

Добавлено: 16 марта 2016 г.

Тематические модели: добавление биграмм и учет сходства между униграммами и биграммами

Нокель М. А., Лукашевич Н. В., Вычислительные методы и программирование 2015 Т. 16 № 2 С. 215-234

Представлены результаты экспериментов по добавлению биграмм в тематические модели и учету сходства между ними и униграммами. Предложен новый алгоритм PLSA-SIM, являю- щийся модификацией алгоритма построения тематических моделей PLSA (Probabilistic Latent Semantic Analysis). Предложенный алгоритм позволяет добавлять биграммы и учитывать сход- ство между ними и униграммными компонентами. Исследована возможность применения ас- социативных мер для выбора и ...

Добавлено: 15 марта 2016 г.

Метод учёта структуры биграмм в тематических моделях

Нокель М. А., Вестник Воронежского государственного университета. Серия: Системный анализ и информационные технологии 2014 № 4 С. 89-97

В статье представлены результаты экспериментов по добавлению сходства между униграммами и биграммами в тематические модели. Вначале изучается возможность применения ассоциативных мер для выбора и последующего включения биграмм в тематические модели. Затем предлагается модификация оригинального алгоритма PLSA, учитывающая похожие униграммы и биграммы, начинающиеся с одних и тех же букв. И в конце статьи предлагается новый итеративный ...

Добавлено: 15 марта 2016 г.

Тематические модели: учет сходства между униграммами и биграммами

М.А. Нокель, В кн. : Selected Papers of XVI All-Russian Scientific Conference "Digital libraries: Advanced Methods and Technologies, Digital Collections". Т. 1297.: Дубна : CEUR Workshop Proceedings, 2014. С. 243-252.

В статье представлены результаты экспериментов по добавлению сходства между униграммами и биграммами в тематические модели. Вначале изучается возможность применения ассоциативных мер для выбора последующего включения биграмм в тематические модели. Затем предлагается модификация оригинального алгоритма PLSA, учитывающая похожие униграммы и биграммы, начинающиеся с одних и тех же букв. И в конце статьи предлагается новый итеративный алгоритм ...

Добавлено: 18 декабря 2014 г.

Topic Models Regularization and Initialization for Regression Problems

Соколов Е. А., Bogolubsky L., , in : Proceedings of the 2015 Workshop on Topic Models: Post-Processing and Applications. : NY : ACM, 2015. P. 21-27.

Добавлено: 24 февраля 2016 г.

Тематические модели в задаче извлечения однословных терминов

М.А. Нокель, Н.В. Лукашевич, Программная инженерия 2014 № 3 С. 34-40

Представлены результаты экспериментального исследования возможности использования тематических моделей в задаче автоматического извлечения однословных терминов. В качестве текстовых коллекций была взята подборка статей из электронных банковских журналов на русском языке и англоязычная часть корпуса параллельных текстов Europarl общественно-политической тематики. Эксперименты показывают, что использование тематической информации способно улучшить качество извлечения однословных терминов независимо от предметной области и ...

Добавлено: 1 октября 2014 г.

Robust PLSA Performs Better Than LDA

Anna Potapenko, Konstantin Vorontsov, , in : Proc. 35th European Conference on Information Retrieval (ECIR 2013): Advances in Information Retrieval. Vol. 7814.: Springer, 2013. P. 784-787.

Добавлено: 23 декабря 2014 г.

Data-Driven Approach To Patient Flow Management And Resource Utilization In Urban Medical Facilities

Elizaveta S. Prokofyeva, Svetlana V. Maltseva, Fomichev N. и др., , in : 2020 IEEE 22nd Conference on Business Informatics (CBI). : IEEE, 2020. P. 71-77.

Добавлено: 31 августа 2020 г.

Robust PLSA Performs Better Than LDA

Konstantin Vorontsov, Potapenko A., Lecture Notes in Computer Science 2013 Vol. 7814 P. 784-787

In this paper we introduce a generalized learning algorithm for probabilistic topic models (PTM). Many known and new algorithms for PLSA, LDA, and SWB models can be obtained as its special cases by choosing a subset of the following “options”: regularization, sampling, update frequency, sparsing and robustness. We show that a robust topic model, which ...

Добавлено: 13 ноября 2013 г.

Additive Regularization for Topic Models of Text Collections

Воронцов К. В., Доклады Академии наук 2014 Vol. 89 No. 3 P. 301-304

Добавлено: 5 декабря 2014 г.

Topic Models Can Improve Domain Term Extraction

Elena Bolshakova, Natalia Loukachevitch, Нокель М. А., , in : Proc. 35th European Conference on Information Retrieval (ECIR 2013): Advances in Information Retrieval. Vol. 7814.: Springer, 2013. P. 684-687.

Добавлено: 1 октября 2014 г.

Proceedings of the 2015 Workshop on Topic Models: Post-Processing and Applications

NY : ACM, 2015

Добавлено: 24 февраля 2016 г.

Использование лингвистической информации в тематической модели PLSA

Нокель М. А., В кн. : Сборник материалов XXI международной конференции студентов, аспирантов и молодых ученых "Ломоносов-2014". : М. : Издательство МГУ, 2014. С. 120-121.

В данной работе предложен метод предобработки коллекции текстов на русском языке, улучшающий качество работы тематических моделей ...

Добавлено: 1 октября 2014 г.

Breeds of cooccurrence: an attempt at classification

Roytberg M.A., Roytberg A.M., Khachko D. V., , in : Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной Международной конференции «Диалог» (Бекасово, 29 мая - 2 июня 2013 г.). В 2-х т. Т. 1: Основная программа конференции. Вып. 12 (19).: М. : РГГУ, 2013. P. 568-578.

Добавлено: 6 мая 2014 г.

Использование тематических моделей в извлечении однословных терминов

Нокель М.А., Лукашевич Н.В., В кн. : Selected Papers of the 15th All-Russian Scientific Conference "Digital Libraries: Advanced Methods and Technologies, Digital Collections", Yaroslavl, Russia, October 14-17, 2013. Vol. 1108.: CEUR Workshop Proceedings, 2013. С. 52-60.

В статье представлены результаты экспериментов по применению тематических моделей к задаче извлечения однословных терминов. В качестве текстовых коллекций была взята подборка статей из электронных банковских журналов на русском языке и англоязычная часть корпуса параллельных текстов Europal. Эксперименты показывают, что использование тематической информации значительно улучшает качество извлечения однословных терминов независимо от предметной области и используемого языка. ...

Добавлено: 1 октября 2014 г.

Topic models can improve domain term extraction

Большакова Е. И., Лукашевич Н. В., Nokel M., , in : Proc. 35th European Conference on Information Retrieval (ECIR 2013): Advances in Information Retrieval. Vol. 7814.: Springer, 2013. P. 684-687.

The paper describes the results of an experimental study of topic models applied to the task of single-word term extraction. The experiments encompass several probabilistic and non-probabilistic topic models and demonstrate that topic information improves the quality of term extraction, as well as NMF with KL-divergence minimization is the best among the models under study. ...

Добавлено: 18 ноября 2013 г.