?
Система для обработки корпусов текстов
С. 245-250.
SYSTEM FOR MANIPULATING TEXT CORPORA
The topic of research is system for manipulating text corpora. In this article it will observed existing solutions and briefly described advantages and disadvantages of them. We will take a closer look at the aim and objectives. The aim of research is developing system for manipulating text corpora. This research revealed four parts of the work process such as creating data storage, experimental-level component, web editor and visual web application. In conclusion it will be included the outputs of our research and further plans. Key words: corpus linguistics, data visualization, DSL, cloud storagesIn book
Пермь : Пермский государственный национальный исследовательский университет, 2016
Plungian V., Русский язык в научном освещении 2008 № 16 (2) С. 7-20
Added: November 12, 2023
Lyashevskaya O., Ovsjannikova M., Szymor N. et al., , in : Quantitative approaches to the Russian language. : Abingdon : Routledge, 2018. P. 51-78.
The domain of modality is structurally diverse and may be described in multiple ways (for example, see Perkins, 1983; Wierzbicka, 1987; Hengeveld, 1988/2004; Sweetser, 1990; Bondarko, 1990; Bybee et al., 1994; van der Auwera and Plungian, 1998; Palmer, 2001; Hansen, 2004; Nuyts, 2006; Khrakovsky, 2007). The article reports on the Russian part of a larger survey ...
Added: October 24, 2017
Orekhov B., Труды института русского языка им. В.В. Виноградова 2015 № 6 С. 449-463
The article continues the trend of other researchers’ publications that demonstrate the opportunities of the poetic subcorpus of the Russian National corpus. The question is, what issues related to the history of Russian poetry can be solved with the help of the corpus. In the first part of the article there is a pilot study ...
Added: March 16, 2016
Kashnitsky I. S., Aburto J. M., Demographic Research 2019 Vol. 41 No. 17 P. 477-490
Background: Creating visualizations that include multiple dimensions of the data while preserving spatial structure and readability is challenging. Here we demonstrate the use of geofaceting to meet this challenge.
Objective: Using data on young adult mortality in the 32 Mexican states from 1990 to 2015, we demonstrate how aligning small multiples for territorial units, often regions, ...
Added: August 16, 2019
Gorina O. G., СПб. : Свое Издательство, 2014
В настоящем издании наглядно иллюстрируются широкие лингводидактические возможности корпусной лингвистики при обучении профессионально-ориентированному общению на английском языке. Обширный языковой материал специально разработанного корпуса профессионального дискурса и других корпусных ресурсов лег в основу вариативных упражнений, заданий, исследований, которые использовались для развития лексических навыков в устной и письменной речи студентов специальности «Регионоведение». Рекомендуется специалистам – филологам, лингводидактам, ...
Added: February 20, 2017
Zaides K., Социо- и психолингвистические исследования 2020 № 8 С. 40-47
В статье рассматриваются особенности употребления прагматических маркеров предикативного типа (знаешь/те, (я) не знаю, (я) (не) думаю (что), представь/те и т. п.) в устной спонтанной речи представителей разных социальных групп. Материалом для исследования послужил рабочий подкорпус, сформированный из 150 000 токенов корпуса повседневной русской речи (фактически – диалогов) «Один речевой день» и 150 000 токенов корпуса ...
Added: February 3, 2022
Piperski A., , in : Компьютерная лингвистика и интеллектуальные технологии. По материалам ежегодной Международной конференции "Диалог" (2015). : М. : Изд-во РГГУ, 2015. P. 494-500.
This paper discusses the notions of acceptability, occurrence, grammaticality and existence, and focuses on the relationship between corpus linguistics and the question of the existence of lexical items. Since corpora are almost exclusively samples from larger populations, it is claimed that they cannot provide evidence for non-existence of words, collocations or constructions. This is because ...
Added: March 13, 2016
Krongauz M., В кн. : Методы когнитивного анализа семантики слова: компьютерно-корпусный подход. : Издательский дом ЯСК, 2019. С. 119-140.
В настоящей работе анализируются сложные случаи полисемии в русском языке с использованием корпусных методов ...
Added: December 6, 2019
Daniel M., , in : Partitive cases and related categories. : Berlin, NY : De Gruyter Mouton, 2014. Ch. 9. P. 347-377.
This paper is an overview of the so-called second genitive in Russian, a nominal form available for a minority of Russian nouns but widely used with these nouns in certain contexts. In many ways, the second genitive is a secondary case. Thus, it may always be substituted with a regular genitive form, while the opposite ...
Added: October 17, 2013
М. : Азбуковник, 2013
В настоящий сборник вошли статьи, подготовленные с использованием материалов поэтического корпуса Национального корпуса русского языка. Авторы статей прослеживают на обширном материале историю отдельных слов в языке поэзии, анализируют разные аспекты поэтической грамматики и семантики, рассматривают некоторые формальные параметры русского стиха.
Сборник предназначен для специалистов в области лингвистической поэтики, стиховедения, а также для тех, кто интересуется современными ...
Added: September 28, 2013
Daniel M., Khurshudian V., , in : Linguistics of Temperature. : Amsterdam : John Benjamins Publishing Company, 2015. P. 392-439.
This paper is an analysis of lexical categorisation of the temperature domain in modern Eastern Armenian. Compared to the vast research outline proposed in (Koptjevskaja-Tamm 2011), this paper has several important limitations. First, it is focused on non-derived, primary temperature terms (most of which happen to be adjectives or nouns, or both). Derived lexical items, ...
Added: October 17, 2013
Piperski A., В кн. : Труды Международной научной конференции "Корпусная лингвистика-2015". : СПб. : Издательство СПбГУ, 2015. С. 374-381.
The paper deals with the use of disyllabic comparative conjunctions budto, slovno and točno ‘like’ in the texts of fifteen Russian poets. I study the frequency of their use in cases where these conjunctions are mutually interchangeable and show that their total frequency increases after the end of the Golden Age of Russian poetry (approx.. ...
Added: March 15, 2017
Kibrik A. A., Khudyakova M., Dobrov G. B. et al., Frontiers in Psychology 2016 Vol. 7 No. 1429 P. 1-21
We report a study of referential choice in discourse production, understood as the choice between various types of referential devices, such as pronouns and full noun phrases. Our goal is to predict referential choice, and to explore to what extent such prediction is possible. Our approach to referential choice includes a cognitively informed theoretical component, ...
Added: September 28, 2016
Piperski A., В кн. : Двенадцатая Конференция по типологии и грамматике для молодых исследователей. Тезисы докладов (Санкт-Петербург, 19–21 ноября 2015 г.). : СПб. : Издательство Нестор-История, 2015. С. 69-72.
Исследование особенностей русских двувидовых глаголов при помощи корпусных методов ...
Added: November 22, 2015
Orekhov B., Krylova I., Popov I. et al., Компьютерная лингвистика и интеллектуальные технологии 2016 No. 15 (22) P. 452-461
Статья о малых языках России в Интернете ...
Added: November 7, 2017
Vydrin V., Rovenchak A., Maslinsky K. A., , in : Actes de la conférence conjointe JEP-TALN-RECITAL 2016. Vol. 11: Traitement automatique des langues africaines (TALAf) .: P. : Association pour le Traitement Automatique des Langues, 2016. P. 87-94.
An annotated corpus of Guinean Maninka, Corpus Maninka de Référence (CMR), was published in April 2016. It includes two subcorpora: one contains texts originally written in Latin-based graphics (792,778 words), and the other one is composed of texts in N'ko alphabet (3,105,879 words). Both subcorpora are searchable in both Latin-based graphics and in N'ko. In ...
Added: March 10, 2017
Ayzatullova Renata, Lyadova Lyudmila, Shalyaeva Irina, International Journal "Information Models and Analyses" 2015 Vol. 4 No. 2 P. 122-141
Abstract: An approach to reengineering business processes through the integration of the domain specific modeling platform and Process Mining tools is described. An analysis of the existing approaches to business processes improvement is presented and restrictions are shown. The Process Mining methods are related to business process reengineering stages and tasks. Comparative analysis of Process ...
Added: January 23, 2016
После, через, спустя во временны́х контекстах: из наблюдений над текстами казахско-русских билингвов
Rakhilina E. V., Казкенова А. К., Akhapkina Y., Вестник Томского государственного университета. Филология 2021 Т. 73 С. 93-113
Рассматриваются случаи нестандартного употребления казахско-русскими билингвами предлогов после, через и спустя во временны́х контекстах. Доказывается,
что отклонения обусловлены грамматическими различиями между родным и русским
языками. Анализ отклонений выявил специфические черты предлогов: способность
указывать на завершение событий и отрезков времени, как единичных, так и повторяющихся, а также неоднозначность через в составе сочетаний с названиями разных
временны́х интервалов. ...
Added: December 1, 2021
Zevakhina N., Dzhakupova S., , in : Материалы 21-й Международной конференции по компьютерной лингвистике "Диалог". : М. : Изд-во РГГУ, 2015.
The Corpus of Russian Student Texts (CoRST) is a computational and research project started in 2013 at the Linguistic Laboratory for Corpora Research Technologies at HSE. It comprises a collection of Russian texts written by students from various Russian universities. Its main research goal is to examine language deviations viewed as markers of language change. ...
Added: May 20, 2015
Skorinkin D., В кн. : Два века в двадцати словах. : М. : Издательский дом НИУ ВШЭ, 2016. С. 294-316.
Статья рассказывает о развитии и изменении значений слова "Публика" на протяжениии XIX-XX веков ...
Added: May 12, 2016
Andriyanets V., Daniel M., Pakendorf B., , in : Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной международной конференции «Диалог» (Москва, 30 мая — 2 июня 2018 г.). Вып. 17(24).: М. : Издательский центр «Российский государственный гуманитарный университет», 2018. P. 28-38.
This paper discusses a method to detect statistically significant linguistic differences between corpora while factoring in possible variability within the very corpora to be compared. Specifically, we compare two small corpora of dialects of Even, Bystraja and Lamunkhin Even, in an attempt to identify morphemes that are more frequent in either of the corpora. To ...
Added: June 19, 2018
Khomenko A., В кн. : Когнитивно-дискурсивная парадигма в лингвистике и смежных науках: современные проблемы и методология исследования: материалы Х Международного конгресса по когнитивной лингвистике. 17–20 сентября 2020 г. Т. 2(41).: Уральский государственный педагогический университет, 2020. С. 893-897.
В настоящей статье речь пойдет о применении интегративного подхода к определению гендера в рамках решения задач судебной лингвистики. Автор интегрирует методы когнитивной науки, корпусной и, шире, компьютерной лингвистики, а также классический структурный анализ текста для идентификации характеристик мужской и женской речи. ...
Added: August 11, 2021
Botchkarev A., Вестник Новосибирского государственного университета. Серия: Лингвистика и межкультурная коммуникация 2016 Т. 14 № 3 С. 5-14
This article explores the ways of displaying fear in the Russian language image of the world. According to the National Corpus of the Russian language, in its most usual manifestation, fear covers and paralyzes; this distressing emotion is caused by somebody, apprehension to lose something or somebody as well as by exposure to an imminent ...
Added: November 28, 2016
Springer, 2023
This book brings together selected revised papers representing a multidisciplinary approach to language and literature. The collection presents studies performed using the methods of computational linguistics in accordance with the traditions of Russian linguistic and literary studies, primarily in line with the Leningrad (Petersburg) philological school. The book comprises the papers allocated into 2 sections ...
Added: September 15, 2023