?
Автоматическое выделение ключевых слов и словосочетаний из русскоязычных корпусов текстов с помощью алгоритма RAKE
С. 268-275.
Moskvina A., Митрофанова О. А., Ерофеева А. Р., Харабет Я. К.
In book
СПб. : Издательство СПбГУ, 2017
Piperski A., В кн. : Труды Международной научной конференции "Корпусная лингвистика-2015". : СПб. : Издательство СПбГУ, 2015. С. 374-381.
The paper deals with the use of disyllabic comparative conjunctions budto, slovno and točno ‘like’ in the texts of fifteen Russian poets. I study the frequency of their use in cases where these conjunctions are mutually interchangeable and show that their total frequency increases after the end of the Golden Age of Russian poetry (approx.. ...
Added: March 15, 2017
Orekhov B., Труды института русского языка им. В.В. Виноградова 2015 № 6 С. 449-463
The article continues the trend of other researchers’ publications that demonstrate the opportunities of the poetic subcorpus of the Russian National corpus. The question is, what issues related to the history of Russian poetry can be solved with the help of the corpus. In the first part of the article there is a pilot study ...
Added: March 16, 2016
Кирина М. А., В кн. : Материалы XXII и XXIII Открытой конференции студентов-филологов. : Издательство СПбГУ, 2021.
Статья посвящена теоретическим аспектам выделения тематики художественного
произведения. Предлагаемый подход апробирован на материале Корпуса русского
рассказа первой трети XX века. Его преимущество заключается в сочетании
литературоведческих и квантитативных подходов к анализу текста, а также в учете
влияния социально-исторического контекста на тему произведения. ...
Added: December 13, 2021
Botchkarev A., Вестник Новосибирского государственного университета. Серия: Лингвистика и межкультурная коммуникация 2016 Т. 14 № 3 С. 5-14
This article explores the ways of displaying fear in the Russian language image of the world. According to the National Corpus of the Russian language, in its most usual manifestation, fear covers and paralyzes; this distressing emotion is caused by somebody, apprehension to lose something or somebody as well as by exposure to an imminent ...
Added: November 28, 2016
Daniel M., Khurshudian V., , in : Linguistics of Temperature. : Amsterdam : John Benjamins Publishing Company, 2015. P. 392-439.
This paper is an analysis of lexical categorisation of the temperature domain in modern Eastern Armenian. Compared to the vast research outline proposed in (Koptjevskaja-Tamm 2011), this paper has several important limitations. First, it is focused on non-derived, primary temperature terms (most of which happen to be adjectives or nouns, or both). Derived lexical items, ...
Added: October 17, 2013
Krongauz M., В кн. : Методы когнитивного анализа семантики слова: компьютерно-корпусный подход. : Издательский дом ЯСК, 2019. С. 119-140.
В настоящей работе анализируются сложные случаи полисемии в русском языке с использованием корпусных методов ...
Added: December 6, 2019
Kuzmina T. A., Ученые записки национального общества прикладной лингвистики 2013 № 1(1) С. 26-35
В работе представлены результаты изучения инструментов корпусной лингвистики, которые представляют широкий спектр возможностей для развития навыков академического письма. Исследуются некоторые практические аспекты названных технологий, которые позволяют существенно улучшить точность и правильность изложения материала. ...
Added: April 24, 2013
Полушин Г. В., В кн. : Математика и междисциплинарные исследования – 2016. : Пермь : Пермский государственный национальный исследовательский университет, 2016. С. 266-269.
RELEVANT DOCUMENTS SEARCH SYSTEM
The article is dedicated to the relevant documents search process automation. Relevant literature search is a non-trivial task, as it requires time and imposes certain requirements to the reader. The paper proposes methods to minimize efforts required to find relevant literatureand to automatize the search process. The analysis of existing software solutions ...
Added: June 9, 2016
Лаврентьев А. М., Рябова Д. М., Тихомирова Е. А. et al., Вопросы кибербезопасности 2020 Т. 3 № 37 С. 58-65
The purpose of the study: development of a technique for comparing special text corpora for subsequent use in the identification of extremist texts Method: frequency methods and a specificity indicator for text analysis of the corpus platform TXM were used. Results: a methodology for comparative analysis of special text corpora has been developed, which makes ...
Added: October 31, 2020
Piperski A., , in : Компьютерная лингвистика и интеллектуальные технологии. По материалам ежегодной Международной конференции "Диалог" (2015). : М. : Изд-во РГГУ, 2015. P. 494-500.
This paper discusses the notions of acceptability, occurrence, grammaticality and existence, and focuses on the relationship between corpus linguistics and the question of the existence of lexical items. Since corpora are almost exclusively samples from larger populations, it is claimed that they cannot provide evidence for non-existence of words, collocations or constructions. This is because ...
Added: March 13, 2016
Kholodilova M., В кн. : Материалы к корпусной грамматике русского языка. Выпуск II. Синтаксические конструкции и грамматические категории. : М. : Издательство Нестор-История, 2017. С. 205-279.
В главе рассматривается устройство относительных предложений в русском языке. Рассматриваются как данные о грамматической приемлемости различных синтаксических структур, так и количественные данные об их распределении, полученные в результате корпусного исследования. ...
Added: January 21, 2019
Piperski A., В кн. : Двенадцатая Конференция по типологии и грамматике для молодых исследователей. Тезисы докладов (Санкт-Петербург, 19–21 ноября 2015 г.). : СПб. : Издательство Нестор-История, 2015. С. 69-72.
Исследование особенностей русских двувидовых глаголов при помощи корпусных методов ...
Added: November 22, 2015
М. : Изд-во РГГУ, 2015
Сборник содержит труды 21-й Международной конференции по компьютерной лингвистике. ...
Added: May 20, 2015
После, через, спустя во временны́х контекстах: из наблюдений над текстами казахско-русских билингвов
Rakhilina E. V., Казкенова А. К., Akhapkina Y., Вестник Томского государственного университета. Филология 2021 Т. 73 С. 93-113
Рассматриваются случаи нестандартного употребления казахско-русскими билингвами предлогов после, через и спустя во временны́х контекстах. Доказывается,
что отклонения обусловлены грамматическими различиями между родным и русским
языками. Анализ отклонений выявил специфические черты предлогов: способность
указывать на завершение событий и отрезков времени, как единичных, так и повторяющихся, а также неоднозначность через в составе сочетаний с названиями разных
временны́х интервалов. ...
Added: December 1, 2021
Orekhov B., Krylova I., Popov I. et al., Компьютерная лингвистика и интеллектуальные технологии 2016 No. 15 (22) P. 452-461
Статья о малых языках России в Интернете ...
Added: November 7, 2017
СПб. : [б.и.], 2021
Труды конференции Корпусная лингвистика-2021 ...
Added: November 23, 2021
Vlasova E., Бец Ю. В., Северина Е. М., В кн. : «Русская грамматика в диалоге научных школ, направлений, методов». : Владивосток : Издательство ДВФУ, 2022.
В статье анализируются нетривиальные фонетические и грамматические явления устной речи иностранцев, изучающих русский язык. Показано, что устный учебный корпус позволяет получить систематическое представление о компенсаторных механизмах речепорождения, проверять и формулировать гипотезы. ...
Added: November 8, 2023
Vydrin V., Rovenchak A., Maslinsky K. A., , in : Actes de la conférence conjointe JEP-TALN-RECITAL 2016. Vol. 11: Traitement automatique des langues africaines (TALAf) .: P. : Association pour le Traitement Automatique des Langues, 2016. P. 87-94.
An annotated corpus of Guinean Maninka, Corpus Maninka de Référence (CMR), was published in April 2016. It includes two subcorpora: one contains texts originally written in Latin-based graphics (792,778 words), and the other one is composed of texts in N'ko alphabet (3,105,879 words). Both subcorpora are searchable in both Latin-based graphics and in N'ko. In ...
Added: March 10, 2017
Zevakhina N., Dzhakupova S., , in : Материалы 21-й Международной конференции по компьютерной лингвистике "Диалог". : М. : Изд-во РГГУ, 2015.
The Corpus of Russian Student Texts (CoRST) is a computational and research project started in 2013 at the Linguistic Laboratory for Corpora Research Technologies at HSE. It comprises a collection of Russian texts written by students from various Russian universities. Its main research goal is to examine language deviations viewed as markers of language change. ...
Added: May 20, 2015
Andriyanets V., Daniel M., Pakendorf B., , in : Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной международной конференции «Диалог» (Москва, 30 мая — 2 июня 2018 г.). Вып. 17(24).: М. : Издательский центр «Российский государственный гуманитарный университет», 2018. P. 28-38.
This paper discusses a method to detect statistically significant linguistic differences between corpora while factoring in possible variability within the very corpora to be compared. Specifically, we compare two small corpora of dialects of Even, Bystraja and Lamunkhin Even, in an attempt to identify morphemes that are more frequent in either of the corpora. To ...
Added: June 19, 2018
Khomenko A., В кн. : Когнитивно-дискурсивная парадигма в лингвистике и смежных науках: современные проблемы и методология исследования: материалы Х Международного конгресса по когнитивной лингвистике. 17–20 сентября 2020 г. Т. 2(41).: Уральский государственный педагогический университет, 2020. С. 893-897.
В настоящей статье речь пойдет о применении интегративного подхода к определению гендера в рамках решения задач судебной лингвистики. Автор интегрирует методы когнитивной науки, корпусной и, шире, компьютерной лингвистики, а также классический структурный анализ текста для идентификации характеристик мужской и женской речи. ...
Added: August 11, 2021
Skorinkin D., В кн. : Два века в двадцати словах. : М. : Издательский дом НИУ ВШЭ, 2016. С. 294-316.
Статья рассказывает о развитии и изменении значений слова "Публика" на протяжениии XIX-XX веков ...
Added: May 12, 2016
Kibrik A. A., Khudyakova M., Dobrov G. B. et al., Frontiers in Psychology 2016 Vol. 7 No. 1429 P. 1-21
We report a study of referential choice in discourse production, understood as the choice between various types of referential devices, such as pronouns and full noun phrases. Our goal is to predict referential choice, and to explore to what extent such prediction is possible. Our approach to referential choice includes a cognitively informed theoretical component, ...
Added: September 28, 2016
Daniel M., , in : Partitive cases and related categories. : Berlin, NY : De Gruyter Mouton, 2014. Ch. 9. P. 347-377.
This paper is an overview of the so-called second genitive in Russian, a nominal form available for a minority of Russian nouns but widely used with these nouns in certain contexts. In many ways, the second genitive is a secondary case. Thus, it may always be substituted with a regular genitive form, while the opposite ...
Added: October 17, 2013