?
Использование тематических моделей в извлечении однословных терминов
С. 52-60.
Нокель М.А., Лукашевич Н.В.
In book
Vol. 1108. , CEUR Workshop Proceedings, 2013
М.А. Нокель, Н.В. Лукашевич, Программная инженерия 2014 № 3 С. 34-40
The paper describes the results of an experimental study of statistical topic models applied to the task of automatic single-word term extraction. The English part of the Europarl parallel corpus from the socio-political domain and the Russian articles taken from online banking magazines were used as target text collections. The experiments demonstrate that topic information ...
Added: October 1, 2014
Elena Bolshakova, Natalia Loukachevitch, Nokel M., , in : Proc. 35th European Conference on Information Retrieval (ECIR 2013): Advances in Information Retrieval. Vol. 7814.: Springer, 2013. P. 684-687.
Abstract. The paper describes the results of an experimental study of
topic models applied to the task of single-word term extraction. The
experiments encompass several probabilistic and non-probabilistic topic
models and demonstrate that topic information improves the quality of
term extraction, as well as NMF with KL-divergence minimization is the
best among the models under study. ...
Added: October 1, 2014
Roytberg M.A., Roytberg A.M., Khachko D. V., , in : Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной Международной конференции «Диалог» (Бекасово, 29 мая - 2 июня 2013 г.). В 2-х т. Т. 1: Основная программа конференции. Вып. 12 (19).: М. : РГГУ, 2013. P. 568-578.
The paper proposes a substantial classification of collocates (pairs of words that tend to cooccur) along with heuristics that can help to attibute a word pair to a proper type automatically.
The best studied type is frequent phrases, which includes idioms, lexicographic collocations, and syntactic selection. Pairs of this type are known to occur at a ...
Added: May 6, 2014
Nokel M., Вестник Воронежского государственного университета. Серия: Системный анализ и информационные технологии 2014 № 4 С. 89-97
The paper presents the results of experimental study of integrating word similarity and bigram collocations into topic models. First of all, we analyze a variety of word association measures in order to integrate top-ranked bigrams into topic models. Then we propose a modification of the original algorithm PLSA, which takes into account similar unigrams and ...
Added: March 15, 2016
Nokel M., В кн. : Сборник материалов XXI международной конференции студентов, аспирантов и молодых ученых "Ломоносов-2014". : М. : Издательство МГУ, 2014. С. 120-121.
В данной работе предложен метод предобработки коллекции текстов на русском языке, улучшающий качество работы тематических моделей ...
Added: October 1, 2014
М.А. Нокель, В кн. : Selected Papers of XVI All-Russian Scientific Conference "Digital libraries: Advanced Methods and Technologies, Digital Collections". Т. 1297.: Дубна : CEUR Workshop Proceedings, 2014. С. 243-252.
В статье представлены результаты экспериментов по добавлению сходства между униграммами и биграммами в тематические модели. Вначале изучается возможность применения ассоциативных мер для выбора последующего включения биграмм в тематические модели. Затем предлагается модификация оригинального алгоритма PLSA, учитывающая похожие униграммы и биграммы, начинающиеся с одних и тех же букв. И в конце статьи предлагается новый итеративный алгоритм ...
Added: December 18, 2014
Ulitin B., Кузьмин В. Г., Кузнецова С. В., Культура физическая и здоровье 2014 № 2(49) С. 71-74
In this paper we consider a modification of the method of conjugate interactions for solution of the problem descriptions of human motor function. ...
Added: November 5, 2014
Nokel M., Loukachevitch N. V., Вычислительные методы и программирование 2015 Т. 16 № 2 С. 215-234
The results of experimental study of adding bigrams and taking account of the similarity between them and unigrams are discussed. A novel PLSA-SIM algorithm based on a modification of the original PLSA (Probabilistic Latent Semantic Analysis) algorithm is proposed. The proposed algorithm incorporates bigrams and takes into account the similarity between them and unigram components. ...
Added: March 15, 2016
Ermilov A., Gostev I. M., Математическое моделирование 2015 Т. 27 № 7 С. 51-57
In the article we consider a method of labeling speaker data using clusterization techniques. Such problems arise when one needs to use speaker data from new channels, for example, mobile devices. These data might then be used to construct a speaker verification system. In the article described a speaker verification task along with some methods ...
Added: December 19, 2014
Zimina E., Shmid A., Новопашин М. А., , in : Data Science. Information Technology and Nanotechnology 2018. Issue 2212.: CEUR Workshop Proceedings, 2018. P. 112-118.
The article includes the observation of the cloud services and technologies usage.
The article contains a review of mathematical analysis of cardiac information using cloud
technology, which produces storage, analysis and forecasting on the basis of owned data. In
addition, the authors consider the possibility of integrating cloud technologies with external
systems. The massive use of mobile devices for ...
Added: July 12, 2019
Vorontsov K. V., Доклады Академии наук 2014 Vol. 89 No. 3 P. 301-304
ARTM advantages:
ARTM is much simpler that Bayesian Inference
ARTM focuses on formalizing task-specific requirements
ARTM simplifies the multi-objective PTMs learning
ARTM reduces barriers to entry into PTMs research field
ARTM encourages the development of regularization library
ARTM restrictions:
Choosing a regularization path is a new open issue for PTMs ...
Added: December 5, 2014
Bolshakova E. I., Loukachevitch N. V., Nokel M., , in : Proc. 35th European Conference on Information Retrieval (ECIR 2013): Advances in Information Retrieval. Vol. 7814.: Springer, 2013. P. 684-687.
The paper describes the results of an experimental study of topic models applied to the task of single-word term extraction. The experiments encompass several probabilistic and non-probabilistic topic models and demonstrate that topic information improves the quality of term extraction, as well as NMF with KL-divergence minimization is the best among the models under study. ...
Added: November 18, 2013
Шустенкова Е. В., Вестник Костромского государственного университета им. Н.А. Некрасова 2011 Т. 17 № 1 С. 257-264
Presentation of possibilities of the new for the humanities method of analyzing dynamics going into digital ranges - wavelet analysis method that, unlike traditional methods, does not constrain digital range mathematical characteristics strictly and also allows finding unobvious processes and natural laws is the aim of this work. ...
Added: December 14, 2012
Столбов М. И., Голощапова И. О., Солнцев О. Г. et al., / Банк России. Серия "Серия докладов об экономических исследованиях". 2017. № 23.
Задачей данной работы является выработка подходов к определению долгосрочных целевых ориенти-ров развития финансового сектора России. Для еѐ решения на основе межстранового анализа авторы пытают-ся выявить различные модели финансового сектора, характеризующиеся спецификой взаимосвязей между по-казателями размера, структуры, эффективности, стабильности, инклюзивности и «качества» развития финан-сового сектора. При этом предполагается, что принадлежность финансового сектора страны к той или ...
Added: September 25, 2017
Bartunov S., Vetrov D., , in : JMLR Workshop and Conference Proceedings. Issue 32: Proceedings of The 31st International Conference on Machine Learning.: Beijing : Microtome Publishing, 2014. P. 1404-1412.
Recently proposed distance dependent Chinese Restaurant Process (ddCRP) generalizes extensively used Chinese Restaurant Process (CRP) by accounting for dependencies between data points. Its posterior is intractable and so far only MCMC methods were used for inference. Because of very different nature of ddCRP no prior developments in variational methods for Bayesian nonparametrics are appliable. In ...
Added: March 4, 2015
Tsukanova O. A., Maltseva S. V., Автоматизация и современные технологии 2013 № 11 С. 26-29
Сформулирован и обоснован концептуальный подход к созданию методики формирования управляемого информационного пространства состояний сетевого сообщества с помощью моделирования условно текстурированной ресурсной среды на основе итерации структуры сетевого сообщества, отображаемого в формате единого информационного ресурса. ...
Added: November 13, 2013
Kurmukov A., Dodonova Y., Zhukov L. E., В кн. : Сборник статей конференции "Информационные технологии и системы" (ИТиС'16). : М. : ИППИ РАН, 2016. С. 501-507.
Мы решаем задачу различения пациентов с рас- стройствами аутистического спектра и людей без патологии на основе графов структурных связей головного мозга (коннектомов). Для этого мы пред- лагаем использовать возможные различия в разби- ениях графов на подграфы, характерные для кон- нектомов групп нормы и патологии. Мы исполь- зуем четыре метода кластеризации, чтобы полу- чить разбиения коннектомов ...
Added: December 9, 2016
Miasnikof P., Shestopaloff A., Pitsoulis L. et al., Journal of Complex Networks 2022 Vol. 10 No. 1 Article cnac003
In this study, we compare distance measures with respect to their ability to capture vertex community structure and the scalability of their computation. Our goal is to find a distance measure which can be used in an aggregate pairwise minimization clustering scheme. The minimization should lead to subsets of vertices with high induced subgraph density. ...
Added: November 21, 2022
Sharov A. G., В кн. : Сборник тезисов. 1-я международная научно-практическая конференция по профильному обучению «Развитие системы профильного обучения в России и за рубежом. Создание единой образовательной среды профильного обучения на основе использования информационных технологий». : М. : МЭСИ, 2005. С. 58-62.
Работа посвящена вопросу воздействия реактивной составляющей автоматизированной обучающей системы на методики обучения с целью достижения оптимального результата образовательной деятельности этой системы. Предлагается использовать модель вычисления показателя синонимической близости двух текстовых выражений, основанную на учете коэффициентов синонимии терминов предметной области, для адаптации учебных курсов. Отмечено, что данная модель принципиально не зависит от изучаемой предметной области и ...
Added: September 21, 2012
Anastasiia D. Sokolova, Angelina S. Kharchevnikova, Savchenko A., , in : Analysis of Images, Social Networks and Texts. 6th International Conference, 2017, Revised Selected Papers. Vol. 10716.: Cham : Springer, 2018. P. 223-230.
In this paper we propose the two-stage approach of organizing information in video surveillance systems. At first, the faces are detected in each frame and a video stream is split into sequences of frames with face region of one person. Secondly, these sequences (tracks) that contain identical faces are grouped using face verification algorithms and ...
Added: May 2, 2018
Shvindt A., Моделирование, оптимизация и информационные технологии 2017 Т. 5 № 4 С. 1-18
The article reviews models and procedures for processing and evaluation of monitoring results, including student participation, focused on intellectual support of administrative managerial decisions when developing of conditions and corresponding resources for the achievement of applicable regulatory requirements for the quality of university education. The first stage of processing is normalization of factors which characterize ...
Added: August 19, 2019
Дубровская К. С., Morozova V., Journal of Siberian Federal University. Series: Humanities & Social Sciences 2016 Vol. 9 No. 11 P. 2575-2580
The article substantiates the necessity for creation and development of a scientifi c-educational cluster under the conditions of activating Russian-Chinese co-development processes in the cross-border sociocultural medium. In the context of persistent expansion of Chinese “soft power”, clustering is more than a way of concentrating material and intellectual resources. Clustering means the only chance for ...
Added: July 20, 2018
Прохоров Е. И., Свитанько И. В., Захаренко А. Л. et al., Pattern Recognition and Image Analysis 2016 Т. 26 № 1
Статья посвящена прогнозированию свойств химических соединений математическими методами распознавания образов. Исследование проведено на примере активности ингибиторов фермента деления клеток. В качестве методов построения распознающих моделей используется подход на базе смесей алгоритмов. В работе рассмотрена двухфазная схема решения задачи «структура – свойство», также описаны локальный классификатор на базе метода ближайших соседей и метод использующий множества кластеризаций. ...
Added: August 24, 2016