A Method of Accounting Bigrams in Topic Models

M. Nokel; N. V. Loukachevitch

Публикации

?

A Method of Accounting Bigrams in Topic Models

P. 1–9.

Нокель М. А., Лукашевич Н. В.

Язык: английский

Текст на другом сайте

Ключевые слова: perplexity Topic Models bigrams topic coherence

В книге

NAACL HLT 2015 11th Workshop on Multiword Expressions MWE 2014

NY: Association for Computational Linguistics, 2015.

Data-Driven Approach To Patient Flow Management And Resource Utilization In Urban Medical Facilities

Elizaveta S. Prokofyeva, Svetlana V. Maltseva, Fomichev N. и др., , in: 2020 IEEE 22nd Conference on Business Informatics (CBI).: IEEE, 2020. P. 71–77.

Добавлено: 31 августа 2020 г.

Topic Models: Accounting Component Structure of Bigrams

Нокель М. А., Лукашевич Н. В., , in: Proceedings of the 20th Nordic Conference of Computational Linguistics (NODALIDA 2015).: Linköping: Linköping University Electronic Press, 2015. P. 145–152.

Добавлено: 16 марта 2016 г.

Тематические модели: добавление биграмм и учет сходства между униграммами и биграммами

Нокель М. А., Лукашевич Н. В., Вычислительные методы и программирование 2015 Т. 16 № 2 С. 215–234

Представлены результаты экспериментов по добавлению биграмм в тематические модели и учету сходства между ними и униграммами. Предложен новый алгоритм PLSA-SIM, являю- щийся модификацией алгоритма построения тематических моделей PLSA (Probabilistic Latent Semantic Analysis). Предложенный алгоритм позволяет добавлять биграммы и учитывать сход- ство между ними и униграммными компонентами. Исследована возможность применения ас- социативных мер для выбора и ...

Добавлено: 15 марта 2016 г.

Метод учёта структуры биграмм в тематических моделях

Нокель М. А., Вестник Воронежского государственного университета. Серия: Системный анализ и информационные технологии 2014 № 4 С. 89–97

В статье представлены результаты экспериментов по добавлению сходства между униграммами и биграммами в тематические модели. Вначале изучается возможность применения ассоциативных мер для выбора и последующего включения биграмм в тематические модели. Затем предлагается модификация оригинального алгоритма PLSA, учитывающая похожие униграммы и биграммы, начинающиеся с одних и тех же букв. И в конце статьи предлагается новый итеративный ...

Добавлено: 15 марта 2016 г.

Topic Models Regularization and Initialization for Regression Problems

Соколов Е. А., Bogolubsky L., , in: Proceedings of the 2015 Workshop on Topic Models: Post-Processing and Applications.: NY: ACM, 2015. P. 21–27.

Добавлено: 24 февраля 2016 г.

Proceedings of the 2015 Workshop on Topic Models: Post-Processing and Applications

NY: ACM, 2015.

Добавлено: 24 февраля 2016 г.

Robust PLSA Performs Better Than LDA

Anna Potapenko, Konstantin Vorontsov, , in: Proc. 35th European Conference on Information Retrieval (ECIR 2013): Advances in Information RetrievalVol. 7814.: Springer, 2013. P. 784–787.

Добавлено: 23 декабря 2014 г.

Тематические модели: учет сходства между униграммами и биграммами

М.А. Нокель, В кн.: Selected Papers of XVI All-Russian Scientific Conference "Digital libraries: Advanced Methods and Technologies, Digital Collections"Т. 1297.: Дубна: CEUR Workshop Proceedings, 2014. С. 243–252.

В статье представлены результаты экспериментов по добавлению сходства между униграммами и биграммами в тематические модели. Вначале изучается возможность применения ассоциативных мер для выбора последующего включения биграмм в тематические модели. Затем предлагается модификация оригинального алгоритма PLSA, учитывающая похожие униграммы и биграммы, начинающиеся с одних и тех же букв. И в конце статьи предлагается новый итеративный алгоритм ...

Добавлено: 18 декабря 2014 г.

Additive Regularization for Topic Models of Text Collections

Воронцов К. В., Доклады Академии наук 2014 Vol. 89 No. 3 P. 301–304

Добавлено: 5 декабря 2014 г.

Использование лингвистической информации в тематической модели PLSA

Нокель М. А., В кн.: Сборник материалов XXI международной конференции студентов, аспирантов и молодых ученых "Ломоносов-2014".: М.: Издательство МГУ, 2014. С. 120–121.

В данной работе предложен метод предобработки коллекции текстов на русском языке, улучшающий качество работы тематических моделей ...

Добавлено: 1 октября 2014 г.

Тематические модели в задаче извлечения однословных терминов

М.А. Нокель, Н.В. Лукашевич, Программная инженерия 2014 № 3 С. 34–40

Представлены результаты экспериментального исследования возможности использования тематических моделей в задаче автоматического извлечения однословных терминов. В качестве текстовых коллекций была взята подборка статей из электронных банковских журналов на русском языке и англоязычная часть корпуса параллельных текстов Europarl общественно-политической тематики. Эксперименты показывают, что использование тематической информации способно улучшить качество извлечения однословных терминов независимо от предметной области и ...

Добавлено: 1 октября 2014 г.

Использование тематических моделей в извлечении однословных терминов

Нокель М.А., Лукашевич Н.В., В кн.: Selected Papers of the 15th All-Russian Scientific Conference "Digital Libraries: Advanced Methods and Technologies, Digital Collections", Yaroslavl, Russia, October 14-17, 2013Vol. 1108.: CEUR Workshop Proceedings, 2013. С. 52–60.

В статье представлены результаты экспериментов по применению тематических моделей к задаче извлечения однословных терминов. В качестве текстовых коллекций была взята подборка статей из электронных банковских журналов на русском языке и англоязычная часть корпуса параллельных текстов Europal. Эксперименты показывают, что использование тематической информации значительно улучшает качество извлечения однословных терминов независимо от предметной области и используемого языка. ...

Добавлено: 1 октября 2014 г.

Topic Models Can Improve Domain Term Extraction

Elena Bolshakova, Natalia Loukachevitch, Нокель М. А., , in: Proc. 35th European Conference on Information Retrieval (ECIR 2013): Advances in Information RetrievalVol. 7814.: Springer, 2013. P. 684–687.

Добавлено: 1 октября 2014 г.