?
Моделирование семантических связей в текстах социальных сетей с помощью алгоритма LDA (на материале русскоязычного сегмента Живого Журнала)
.
Митрофанова О. А., Шиморина А. С.
Publication based on the results of:
In book
Кн. 10. , СПб. : Издательство Санкт-Петербургского государственного университета, 2014
70089316, Maslinsky K. A., Социология: методология, методы, математическое моделирование 2013
В статье изложены методологические результаты исследования русскоязычных блогов. Произведена адаптация и апробация автоматизированных методов анализа текстов и соответствующего программного обеспечения для решения содержательных задач (выявление тематической структуры блогосферы, описание ее изменений во времени, выявление процесса образования дискуссионных сообществ). Выделяются и описываются два класса методов деления больших массивов текстов на группы – кластерный анализ и тематическое ...
Added: November 18, 2013
Nagornyy O. S., Мониторинг общественного мнения: Экономические и социальные перемены 2017 № 4 С. 165-184
The paper presents the results of a study based on the Big Data paradigm analysis. The study aims at defining the features of the ethnic discourse in the Russian-speaking social media and the place of the North Caucasus ethnicities in this discourse. The informational basis for the study is 2,659,849 social media publications containing ethnonyms. ...
Added: August 21, 2017
Пермь : ИП Сигитов Т.М., 2016
В сборнике освещаются актуальные теоретические и практические проблемы развития территорий. Представлены научные достижения ученых, специалистов, аспирантов, соискателей, магистрантов и студентов. Предназначено для преподавателей, аспирантов и студентов, для всех, кто занимается научными исследованиями в области развития территорий. ...
Added: October 27, 2018
Piperski A., , in : Компьютерная лингвистика и интеллектуальные технологии. По материалам ежегодной Международной конференции "Диалог" (2015). : М. : Изд-во РГГУ, 2015. P. 494-500.
This paper discusses the notions of acceptability, occurrence, grammaticality and existence, and focuses on the relationship between corpus linguistics and the question of the existence of lexical items. Since corpora are almost exclusively samples from larger populations, it is claimed that they cannot provide evidence for non-existence of words, collocations or constructions. This is because ...
Added: March 13, 2016
Kholodilova M., В кн. : Материалы к корпусной грамматике русского языка. Выпуск II. Синтаксические конструкции и грамматические категории. : М. : Издательство Нестор-История, 2017. С. 205-279.
В главе рассматривается устройство относительных предложений в русском языке. Рассматриваются как данные о грамматической приемлемости различных синтаксических структур, так и количественные данные об их распределении, полученные в результате корпусного исследования. ...
Added: January 21, 2019
Daniel M., Khurshudian V., , in : Linguistics of Temperature. : Amsterdam : John Benjamins Publishing Company, 2015. P. 392-439.
This paper is an analysis of lexical categorisation of the temperature domain in modern Eastern Armenian. Compared to the vast research outline proposed in (Koptjevskaja-Tamm 2011), this paper has several important limitations. First, it is focused on non-derived, primary temperature terms (most of which happen to be adjectives or nouns, or both). Derived lexical items, ...
Added: October 17, 2013
СПб. : [б.и.], 2021
Труды конференции Корпусная лингвистика-2021 ...
Added: November 23, 2021
Vydrin V., Rovenchak A., Maslinsky K. A., , in : Actes de la conférence conjointe JEP-TALN-RECITAL 2016. Vol. 11: Traitement automatique des langues africaines (TALAf) .: P. : Association pour le Traitement Automatique des Langues, 2016. P. 87-94.
An annotated corpus of Guinean Maninka, Corpus Maninka de Référence (CMR), was published in April 2016. It includes two subcorpora: one contains texts originally written in Latin-based graphics (792,778 words), and the other one is composed of texts in N'ko alphabet (3,105,879 words). Both subcorpora are searchable in both Latin-based graphics and in N'ko. In ...
Added: March 10, 2017
Zakhlebin I. V., В кн. : Supplementary Proceedings of the 3rd International Conference on Analysis of Images, Social Networks and Texts (AIST 2014). Vol. 1197: Supplementary Proceedings of AIST 2014.: Ekaterinburg : CEUR Workshop Proceedings, 2014. С. 187-191.
This paper presents a semantic method for searching for the experts. The method operates over a set of texts authored by themselves. The query format allowing one to define a set of the selected skills, and the algorithms for constructing and comparing the semantic representations are also presented. The ExpSearch-1 (Experts Search, version 1) system ...
Added: July 11, 2015
Skorinkin D., В кн. : Два века в двадцати словах. : М. : Издательский дом НИУ ВШЭ, 2016. С. 294-316.
Статья рассказывает о развитии и изменении значений слова "Публика" на протяжениии XIX-XX веков ...
Added: May 12, 2016
Moskvina A., Митрофанова О. А., Ерофеева А. Р. et al., В кн. : Труды международной конференции «КОРПУСНАЯ ЛИНГВИСТИКА – 2017». : СПб. : Издательство СПбГУ, 2017. С. 268-275.
В работе представлены результаты работы по модификации алгоритма RAKE, используемого для быстрого извлечения ключевых слов и словосочетаний. В качестве источника информации о границах синтаксических групп в RAKE предлагаются правила грамматики синтаксического анализатора для русского языка на основе NLTK (NLTK4RUSSIAN). Для определения эффективности работы алгоритма с русскоязычными текстами были проведены эксперименты на материале представительных корпусов. ...
Added: September 29, 2020
Kibrik A. A., Khudyakova M., Dobrov G. B. et al., Frontiers in Psychology 2016 Vol. 7 No. 1429 P. 1-21
We report a study of referential choice in discourse production, understood as the choice between various types of referential devices, such as pronouns and full noun phrases. Our goal is to predict referential choice, and to explore to what extent such prediction is possible. Our approach to referential choice includes a cognitively informed theoretical component, ...
Added: September 28, 2016
Piperski A., В кн. : Двенадцатая Конференция по типологии и грамматике для молодых исследователей. Тезисы докладов (Санкт-Петербург, 19–21 ноября 2015 г.). : СПб. : Издательство Нестор-История, 2015. С. 69-72.
Исследование особенностей русских двувидовых глаголов при помощи корпусных методов ...
Added: November 22, 2015
Korshunov I., Shirkova N., Завиваев Н. С., Экономика региона 2021 Т. 17 № 3 С. 873-887
Knowledge and skills concentrated in human capital are increasingly important factors of economic development. However, there is a lack of a methodology for determining, which skills are necessary for the efficient industrial development. To this end, we examine skill requirements of regional employers potentially leading to an increase in economic indicators. Skills in demand were ...
Added: September 28, 2021
Кирина М. А., В кн. : Материалы XXII и XXIII Открытой конференции студентов-филологов. : Издательство СПбГУ, 2021.
Статья посвящена теоретическим аспектам выделения тематики художественного
произведения. Предлагаемый подход апробирован на материале Корпуса русского
рассказа первой трети XX века. Его преимущество заключается в сочетании
литературоведческих и квантитативных подходов к анализу текста, а также в учете
влияния социально-исторического контекста на тему произведения. ...
Added: December 13, 2021
Orekhov B., Krylova I., Popov I. et al., Компьютерная лингвистика и интеллектуальные технологии 2016 No. 15 (22) P. 452-461
Статья о малых языках России в Интернете ...
Added: November 7, 2017
Kuzmina T. A., Ученые записки национального общества прикладной лингвистики 2013 № 1(1) С. 26-35
В работе представлены результаты изучения инструментов корпусной лингвистики, которые представляют широкий спектр возможностей для развития навыков академического письма. Исследуются некоторые практические аспекты названных технологий, которые позволяют существенно улучшить точность и правильность изложения материала. ...
Added: April 24, 2013
Vlasova E., Бец Ю. В., Северина Е. М., В кн. : «Русская грамматика в диалоге научных школ, направлений, методов». : Владивосток : Издательство ДВФУ, 2022.
В статье анализируются нетривиальные фонетические и грамматические явления устной речи иностранцев, изучающих русский язык. Показано, что устный учебный корпус позволяет получить систематическое представление о компенсаторных механизмах речепорождения, проверять и формулировать гипотезы. ...
Added: November 8, 2023
Zevakhina N., Dzhakupova S., , in : Материалы 21-й Международной конференции по компьютерной лингвистике "Диалог". : М. : Изд-во РГГУ, 2015.
The Corpus of Russian Student Texts (CoRST) is a computational and research project started in 2013 at the Linguistic Laboratory for Corpora Research Technologies at HSE. It comprises a collection of Russian texts written by students from various Russian universities. Its main research goal is to examine language deviations viewed as markers of language change. ...
Added: May 20, 2015
Andriyanets V., Daniel M., Pakendorf B., , in : Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной международной конференции «Диалог» (Москва, 30 мая — 2 июня 2018 г.). Вып. 17(24).: М. : Издательский центр «Российский государственный гуманитарный университет», 2018. P. 28-38.
This paper discusses a method to detect statistically significant linguistic differences between corpora while factoring in possible variability within the very corpora to be compared. Specifically, we compare two small corpora of dialects of Even, Bystraja and Lamunkhin Even, in an attempt to identify morphemes that are more frequent in either of the corpora. To ...
Added: June 19, 2018
Лаврентьев А. М., Рябова Д. М., Тихомирова Е. А. et al., Вопросы кибербезопасности 2020 Т. 3 № 37 С. 58-65
The purpose of the study: development of a technique for comparing special text corpora for subsequent use in the identification of extremist texts Method: frequency methods and a specificity indicator for text analysis of the corpus platform TXM were used. Results: a methodology for comparative analysis of special text corpora has been developed, which makes ...
Added: October 31, 2020
Khomenko A., В кн. : Когнитивно-дискурсивная парадигма в лингвистике и смежных науках: современные проблемы и методология исследования: материалы Х Международного конгресса по когнитивной лингвистике. 17–20 сентября 2020 г. Т. 2(41).: Уральский государственный педагогический университет, 2020. С. 893-897.
В настоящей статье речь пойдет о применении интегративного подхода к определению гендера в рамках решения задач судебной лингвистики. Автор интегрирует методы когнитивной науки, корпусной и, шире, компьютерной лингвистики, а также классический структурный анализ текста для идентификации характеристик мужской и женской речи. ...
Added: August 11, 2021
Piperski A., В кн. : Труды Международной научной конференции "Корпусная лингвистика-2015". : СПб. : Издательство СПбГУ, 2015. С. 374-381.
The paper deals with the use of disyllabic comparative conjunctions budto, slovno and točno ‘like’ in the texts of fifteen Russian poets. I study the frequency of their use in cases where these conjunctions are mutually interchangeable and show that their total frequency increases after the end of the Golden Age of Russian poetry (approx.. ...
Added: March 15, 2017
Botchkarev A., Вестник Новосибирского государственного университета. Серия: Лингвистика и межкультурная коммуникация 2016 Т. 14 № 3 С. 5-14
This article explores the ways of displaying fear in the Russian language image of the world. According to the National Corpus of the Russian language, in its most usual manifestation, fear covers and paralyzes; this distressing emotion is caused by somebody, apprehension to lose something or somebody as well as by exposure to an imminent ...
Added: November 28, 2016