?
A Method of Accounting Bigrams in Topic Models
P. 1-9.
Нокель М. А., Лукашевич Н. В.
В книге
NY : Association for Computational Linguistics, 2015
Нокель М. А., Лукашевич Н. В., , in : Proceedings of the 20th Nordic Conference of Computational Linguistics (NODALIDA 2015). : Linköping : Linköping University Electronic Press, 2015. P. 145-152.
Добавлено: 16 марта 2016 г.
Нокель М. А., Лукашевич Н. В., Вычислительные методы и программирование 2015 Т. 16 № 2 С. 215-234
Представлены результаты экспериментов по добавлению биграмм в тематические модели и учету сходства между ними и униграммами. Предложен новый алгоритм PLSA-SIM, являю- щийся модификацией алгоритма построения тематических моделей PLSA (Probabilistic Latent Semantic Analysis). Предложенный алгоритм позволяет добавлять биграммы и учитывать сход- ство между ними и униграммными компонентами. Исследована возможность применения ас- социативных мер для выбора и ...
Добавлено: 15 марта 2016 г.
Нокель М. А., Вестник Воронежского государственного университета. Серия: Системный анализ и информационные технологии 2014 № 4 С. 89-97
В статье представлены результаты экспериментов по добавлению сходства между униграммами и биграммами в тематические модели. Вначале изучается возможность применения ассоциативных мер для выбора и последующего включения биграмм в тематические модели. Затем предлагается модификация оригинального алгоритма PLSA, учитывающая похожие униграммы и биграммы, начинающиеся с одних и тех же букв. И в конце статьи предлагается новый итеративный ...
Добавлено: 15 марта 2016 г.
М.А. Нокель, В кн. : Selected Papers of XVI All-Russian Scientific Conference "Digital libraries: Advanced Methods and Technologies, Digital Collections". Т. 1297.: Дубна : CEUR Workshop Proceedings, 2014. С. 243-252.
В статье представлены результаты экспериментов по добавлению сходства между униграммами и биграммами в тематические модели. Вначале изучается возможность применения ассоциативных мер для выбора последующего включения биграмм в тематические модели. Затем предлагается модификация оригинального алгоритма PLSA, учитывающая похожие униграммы и биграммы, начинающиеся с одних и тех же букв. И в конце статьи предлагается новый итеративный алгоритм ...
Добавлено: 18 декабря 2014 г.
Соколов Е. А., Bogolubsky L., , in : Proceedings of the 2015 Workshop on Topic Models: Post-Processing and Applications. : NY : ACM, 2015. P. 21-27.
Добавлено: 24 февраля 2016 г.
М.А. Нокель, Н.В. Лукашевич, Программная инженерия 2014 № 3 С. 34-40
Представлены результаты экспериментального исследования возможности использования тематических моделей в задаче автоматического извлечения однословных терминов. В качестве текстовых коллекций была взята подборка статей из электронных банковских журналов на русском языке и англоязычная часть корпуса параллельных текстов Europarl общественно-политической тематики. Эксперименты показывают, что использование тематической информации способно улучшить качество извлечения однословных терминов независимо от предметной области и ...
Добавлено: 1 октября 2014 г.
Anna Potapenko, Konstantin Vorontsov, , in : Proc. 35th European Conference on Information Retrieval (ECIR 2013): Advances in Information Retrieval. Vol. 7814.: Springer, 2013. P. 784-787.
Добавлено: 23 декабря 2014 г.
Data-Driven Approach To Patient Flow Management And Resource Utilization In Urban Medical Facilities
Elizaveta S. Prokofyeva, Svetlana V. Maltseva, Fomichev N. и др., , in : 2020 IEEE 22nd Conference on Business Informatics (CBI). : IEEE, 2020. P. 71-77.
Добавлено: 31 августа 2020 г.
Konstantin Vorontsov, Potapenko A., Lecture Notes in Computer Science 2013 Vol. 7814 P. 784-787
In this paper we introduce a generalized learning algorithm for probabilistic topic models (PTM). Many known and new algorithms for PLSA, LDA, and SWB models can be obtained as its special cases by choosing a subset of the following “options”: regularization, sampling, update frequency, sparsing and robustness. We show that a robust topic model, which ...
Добавлено: 13 ноября 2013 г.
Воронцов К. В., Доклады Академии наук 2014 Vol. 89 No. 3 P. 301-304
Добавлено: 5 декабря 2014 г.
Elena Bolshakova, Natalia Loukachevitch, Нокель М. А., , in : Proc. 35th European Conference on Information Retrieval (ECIR 2013): Advances in Information Retrieval. Vol. 7814.: Springer, 2013. P. 684-687.
Добавлено: 1 октября 2014 г.
NY : ACM, 2015
Добавлено: 24 февраля 2016 г.
Нокель М. А., В кн. : Сборник материалов XXI международной конференции студентов, аспирантов и молодых ученых "Ломоносов-2014". : М. : Издательство МГУ, 2014. С. 120-121.
В данной работе предложен метод предобработки коллекции текстов на русском языке, улучшающий качество работы тематических моделей ...
Добавлено: 1 октября 2014 г.
Roytberg M.A., Roytberg A.M., Khachko D. V., , in : Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной Международной конференции «Диалог» (Бекасово, 29 мая - 2 июня 2013 г.). В 2-х т. Т. 1: Основная программа конференции. Вып. 12 (19).: М. : РГГУ, 2013. P. 568-578.
Добавлено: 6 мая 2014 г.
Нокель М.А., Лукашевич Н.В., В кн. : Selected Papers of the 15th All-Russian Scientific Conference "Digital Libraries: Advanced Methods and Technologies, Digital Collections", Yaroslavl, Russia, October 14-17, 2013. Vol. 1108.: CEUR Workshop Proceedings, 2013. С. 52-60.
В статье представлены результаты экспериментов по применению тематических моделей к задаче извлечения однословных терминов. В качестве текстовых коллекций была взята подборка статей из электронных банковских журналов на русском языке и англоязычная часть корпуса параллельных текстов Europal. Эксперименты показывают, что использование тематической информации значительно улучшает качество извлечения однословных терминов независимо от предметной области и используемого языка. ...
Добавлено: 1 октября 2014 г.
Большакова Е. И., Лукашевич Н. В., Nokel M., , in : Proc. 35th European Conference on Information Retrieval (ECIR 2013): Advances in Information Retrieval. Vol. 7814.: Springer, 2013. P. 684-687.
The paper describes the results of an experimental study of topic models applied to the task of single-word term extraction. The experiments encompass several probabilistic and non-probabilistic topic models and demonstrate that topic information improves the quality of term extraction, as well as NMF with KL-divergence minimization is the best among the models under study. ...
Добавлено: 18 ноября 2013 г.