• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • A
  • A
  • A
  • A
  • A
Обычная версия сайта
  • RU
  • EN
  • HSE University
  • Publications
  • Book chapter
  • Pragmatic Markers in Russian Spoken Speech: an Experience of Systematization and Annotation for the Improvement of NLP Tasks
  • RU
  • EN
Расширенный поиск
Высшая школа экономики
Национальный исследовательский университет
Priority areas
  • business informatics
  • economics
  • engineering science
  • humanitarian
  • IT and mathematics
  • law
  • management
  • mathematics
  • sociology
  • state and public administration
by year
  • 2027
  • 2026
  • 2025
  • 2024
  • 2023
  • 2022
  • 2021
  • 2020
  • 2019
  • 2018
  • 2017
  • 2016
  • 2015
  • 2014
  • 2013
  • 2012
  • 2011
  • 2010
  • 2009
  • 2008
  • 2007
  • 2006
  • 2005
  • 2004
  • 2003
  • 2002
  • 2001
  • 2000
  • 1999
  • 1998
  • 1997
  • 1996
  • 1995
  • 1994
  • 1993
  • 1992
  • 1991
  • 1990
  • 1989
  • 1988
  • 1987
  • 1986
  • 1985
  • 1984
  • 1983
  • 1982
  • 1981
  • 1980
  • 1979
  • 1978
  • 1977
  • 1976
  • 1975
  • 1974
  • 1973
  • 1972
  • 1971
  • 1970
  • 1969
  • 1968
  • 1967
  • 1966
  • 1965
  • 1964
  • 1963
  • 1958
  • More
Subject
News
May 25, 2026
HSE Scientists Train Neural Network to 'Hear' Faults in Electric Motors
Researchers at the AI and Digital Science Institute of the HSE Faculty of Computer Science have developed a new method—the Signature-Guided Data Augmentation (SGDA) framework—that achieves 99% accuracy in motor fault detection and 86% accuracy in fault classification. The application of this approach can reduce industrial equipment repair costs, minimise downtime, and improve production safety. The study results have been published in Engineering Applications of Artificial Intelligence.
May 25, 2026
'The Humanities Serve as a Conscience'
Maria Mizernaia studies Soviet literature and the history of book publishing. In this interview for the HSE Young Scientists project, she discusses plans to publish a novel about besieged Leningrad, AI-provoked reflections on what it means to be human, and how novels can help satisfy our dopamine hunger.
May 25, 2026
Is It Possible to Predict a Citys Life Based on the Shape of Its Neighbourhoods?
Is it possible to predict, based on the configuration of streets and buildings, where a café will open or where traffic congestion will occur? Participants in the Spatial Analysis and Modelling of Urban Processes research and study group use open data and machine learning to identify universal patterns. Alexander Sheludkov and Eduard Somov discuss the purpose of comparing cities, the need for new forms of urban statistics, and how open data is transforming approaches to urban studies.

 

Have you spotted a typo?
Highlight it, click Ctrl+Enter and send us a message. Thank you for your help!

Publications
  • Books
  • Articles
  • Chapters of books
  • Working papers
  • Report a publication
  • Research at HSE

?

Pragmatic Markers in Russian Spoken Speech: an Experience of Systematization and Annotation for the Improvement of NLP Tasks

P. 69–77.
Богданова-Бегларян Н. В., Blinova O. V., Sherstinova T., Martynenko G. Y., Zaides K.

Pragmatic markers are an integral part of spontaneous spoken speech, however, they still have no systematic scientific description. These speech elements perform mostly pragmatic functions and are characterized by almost complete absence (or significant weakening) of lexical and/or grammatical meaning. The frequency of pragmatic markers in speech exceeds that of almost all content words. Because of that, for the improvement of many current NLP tasks, it is very important to obtain proper systematization of pragmatic markers and to develop effective and reliable schemes for their annotation. In current research, we describe the preliminary set of pragmatic markers categories and present the results of two stages of their pilot annotation made independently by a group of experts.

The presented research was supported by the Russian Science Foundation, project # 18-18-00242 “Pragmatic Markers in Russian Everyday Speech”.

Language: English
Full text
DOI
Text on another site
Keywords: inter-annotator agreementRussian speech corpusречевой корпусpragmatic markersручная разметкаmanual annotationсогласие между аннотаторамипрагматические маркеры

In book

23rd Conference of Open Innovations Association FRUCT, FRUCT 2018
IEEE Computer Society, 2018.
Similar publications
Функциональный подход к описанию дискурсивных слов русского языка
Белов В. А., Belova V., Русистика 2025 Т. 23 № 2 С. 206–224
The relevance of the study is in the fact that modern Russian linguistic science has not developed a full-fledged description of Russian discursive words despite their frequen- cy in Russian speech. The aim of the study is to describe the pragmatic functions of discursive words in the text. Frequent Russian discursive words expressing the degree ...
Added: September 8, 2025
Конструкции устной спонтанной речи: опыт систематизации на современном корпусном материале
Богданова-Бегларян Н. В., Попова Т. И., Коммуникативные исследования 2025 Т. 12 № 1 С. 37–53
Статья посвящена описанию опыта систематизации устойчивых неоднословных единиц (УНЕ) из класса конструкций (КС). КС рассматриваются в работе с позиций грамматики конструкций, т. е. в этот класс отнесены все УНЕ, включающие в свой состав не только постоянные компоненты, но и переменные (слоты), которые обозначаются символами Х и Y: <Х-у не до Y-ка> (мне до вас), <из X-а ...
Added: September 3, 2025
Аннотирование прагматических маркеров в русском речевом корпусе: проблемы, поиски, решения, результаты
Попова Т. И., Sherstinova T., Блинова О. В. et al., В кн.: Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной международной конференции «Диалог» (Москва, 29 мая — 1 июня 2019 г.)Вып. 18.: М.: Издательский центр «Российский государственный гуманитарный университет», 2019. С. 72–85.
В статье описывается опыт аннотирования прагматических маркеров (ПМ) в двух русских речевых корпусах: «Один речевой день» (ОРД; диалоги) и «Сбалансированная аннотированная текстотека» (САТ; монологи). Для подготовки сплошной разметки ПМ было проведено 4 пилотных аннотирования на выборках из ОРД и САТ, что позволило сформировать итоговый список ПМ: 450 единиц, представляющих собой варианты 53 базовых структурных типов. ...
Added: November 21, 2024
Investigating Appraisal and the language of evaluation in fake news corpora
Trnavac R., Poldvere N., Corpus Pragmatics 2024 Vol. 8 No. 2 P. 107–130
Abstract The present corpus study, which is grounded in Appraisal Theory, investigates evaluative language use in fake news in English. The primary aim is to find out how and why, if at all, evaluative meanings are construed differently in fake news compared to genuine news. The secondary aim is to explore potential differences between types of fake news based on ...
Added: August 27, 2024
Everyday Conversations: a Comparative Study of Expert Transcriptions and ASR Outputs at a Lexical Level
Sherstinova T., Михайловский Н. Э., Kolobov R., Lecture Notes in Computer Science 2023 Vol. 14338 P. 43–56
The study examines the outcomes of automatic speech recognition (ASR) applied to field recordings of daily Russian speech. Everyday conversations, captured in real-life communicative scenarios, pose quite a complex subject for ASR. This is due to several factors: they can contain speech from a multitude of speakers, the loudness of the conversation partners’ speech signals ...
Added: December 9, 2023
The Function of Metacommunicative Markers in Russian-Speaking Communication (a Sociolinguistic Aspect)
T.I. Popova, Communication studies 2021 Vol. 8 No. 3 P. 454–464
The article considers the use of metacommunicative pragmatic markers in the gender aspect, taking into account the social roles of the speaker. The research is carried out on the data of ORD corpus Russian Everyday Speech known as “One Speaker’s Day” corpus, based on transcripts of audio recordings obtained under actual conditions. The volume of ...
Added: October 16, 2023
Прагматические маркеры метакоммуникации: гендерный аспект
Попова Т. И., Вестник Пермского университета. Российская и зарубежная филология 2021 Т. 13 № 3 С. 40–50
В статье рассматривается использование прагматических маркеров метакоммуникации в гендерном аспекте и с учетом социальных ролей говорящего. Источником материала послужил Корпус русского языка повседневного общения «Один речевой день», разработанный на основе расшифровок аудиозаписей, полученных в естественных условиях. Объем выборки составляет около 200 тыс. словоупотреблений. В ней представлены эпизоды «речевых дней» 15 женщин и 15 мужчин трех возрастных групп. Информанты ...
Added: October 16, 2023
Анализ разговорной русской речи (АР3-2021): Труды девятого междисциплинарного семинара
Попова Т. И., Скифия-принт, 2021.
Прагматические маркеры (ПМ) являются теми функциональными единицами устной речи, которые помогают говорящему выстраивать дискурс, вербализуют его колебания, сомнения, затруднения, рефлексию, а порой напрямую отражают его коммуникативные намерения. Анализ функционирования ПМ в речи говорящих, выступающих в коммуникации в разных социальных ролях, может выявить особенности, которые способны коррелировать с разными ролями как разными кодами. Это позволит говорить о ПМ ...
Added: October 16, 2023
Прагматические маркеры предикативного типа в русской устной спонтанной речи: формальные типы и их реализации
Zaides K., Русская речь 2020 № 2 С. 44–61
Статья посвящена описанию основных формальных типов прагматических маркеров предикативного типа (ПМПТ) в русской устной спонтанной речи. В работе предлагается типология ПМПТ, выявленных на материале двух корпусов устной речи — корпуса диалогов «Один речевой день» (ОРД) и корпуса монологов Сбалансированная аннотированная текстотека» (САТ). Предлагаемый подход к описанию прагматических маркеров (ПМ) подразумевает учет синтаксической структуры исследуемых единиц, на основе чего выделяются ...
Added: February 3, 2022
Прагматический маркер ИЛИ ТАМ: свой среди чужих, чужой среди своих
Zaides K., Русская речь 2021 № 1 С. 22–36
В статье описываются функции и специфика употребления одного из прагматических маркеров, встречающихся в устной спонтанной речи, – или там. Данный маркер формально схож по модели построения с рефлексивными маркерами – или как его/её/их, или как это, или что и под. Однако, в отличие от этих маркеров, единица или там, как показано в статье, выполняет в устной речи принципиально иные функции – аппроксимативную ...
Added: February 3, 2022
Pragmatic Markers of Russian Everyday Speech: Invariants in Dialogue and Monologue
Bogdanova-Beglarian N., Blinova O. V., Sherstinova T. et al., , in: Speech and Computer. 23rd International Conference, SPECOM 2021, St. Petersburg, Russia, September 27–30, 2021Vol. 12997.: St. Petersburg: Springer, 2021. P. 81–90.
The paper presents the distribution of pragmatic markers (PM) of Russian everyday speech in two types of discourse: dialogical and monologic. PMs are an essential part of any oral discourse, therefore, quantitative data on their distribution are necessary for solving both theoretical and practical tasks related to studies of speech communication, as well as for ...
Added: October 31, 2021
Communication Failures in Everyday Conversations: a Case Study Based on the “Retrospective Commenting Method”
Mustajoki A., Cherkunova N., Sherstinova T., , in: Computational Linguistics and Intellectual Technologies: Papers from the Annual International Conference “Dialogue” (2021)Issue 20: Основной том.: -, 2021. P. 514–523.
The paper deals with communication failures in everyday spoken discourse. The spontaneous character of oral speech is its basic property and becomes a prerequisite for the appearance of such a phenomenon as communicative failures. By communicative failures, we mean speech situations when the recipient of a speech message does not understand it correctly, i.e., in ...
Added: August 31, 2021
Pragmatic markers in the aspect of communicative alignment
Трощенкова Е. В., Blinova O. V., Вестник Волгоградского государственного университета. Серия 2: Языкознание 2020 Vol. 19 No. 3 P. 49–58
The article presents a model of communicative alignment in pragmatic markers (PM) use in Russian everyday dialogical communication. The main objectives are to check whether speakers coordinate their linguistic behavior not just with the use of lexemes or grammar forms or constructions, but also with PMs and how this actually works. We suppose that the ...
Added: November 1, 2020
Позиционные свойства русских усеченных обращений и дискурсивных маркеров типа 'слушай'
Blinova O. V., Acta Linguistica Petropolitana. Труды института лингвистических исследований 2019 Т. 15 № 3 С. 185–204
The paper tests the hypothesis of positional similarity between truncated vocative forms (TVFs) like mam, pap, Tan’ (instead of, respectively, mama ‘mom’, papa ‘dad’, Tanya) and discourse markers (DMs) of the type “slushay”, “poslushay” (lit. ‘listen.2.Imp’). The hypothesis is based on the functional similarity of these expressions that belong to a wide category of parentheticals and ...
Added: November 1, 2020
Позиционные свойства русских апеллятивов: формат описания в речевом корпусе
Blinova O. V., Компьютерная лингвистика и интеллектуальные технологии 2018 Т. 2 № 17(24) С. 96–109
The article suggests a way of modelling the linear position of appellatives in Russian. Under the name «appellatives» are combined the units with similar functions and syntactic properties, namely truncated vocative forms and discursive markers of the type «slushaj» (lit. ‘listen-Imp.2P’). The model assumes distinction between accented and non-accented uses in three positions (initial, middle, ...
Added: November 1, 2020
Pragmatic Markers of Russian Everyday Speech: the Revised Typology and Corpus-Based Study
Богданова-Бегларян Н. В., Blinova O. V., Sherstinova T. et al., , in: Proceedings of the 25th Conference of Open Innovations Association FRUCT, University of Helsinki, Helsinki, Finland.: Helsinki: IEEE, 2019. P. 57–63.
Pragmatic markers (PMs) mainly have an influence on a pragmatic aspect of communication and are mostly devoid of their own referential meaning. These markers are indispensable elements of oral communication in any language. The article suggests a typology of pragmatic markers for Russian everyday speech that includes 10 basic types. The frequency study for the ...
Added: October 31, 2019
О подготовке к веб-публикации корпуса повседневной русской речи «Один речевой день»: анонимизация текстов и выборочное кодирование лексики
Sherstinova T., В кн.: Труды международной конференции "Корпусная лингвистика - 2019".: СПб.: Издательство Санкт-Петербургского университета, 2019. С. 366–372.
Речевой корпус «Один речевой день» (ОРД) является на сегодняшний день крупнейшим лингвистическим ресурсом, предназначенным для исследования русского языка повседневного общения. Несмотря на высокий научный потенциал материалов корпуса, эффек-тивность его использования до сих пор существенно ограничена фактом закрытости ресурса для широкого круга пользователей, что вызвано частным характером большинства звукозаписей повседневной речи. Компромиссным решением представляется веб-публикация анонимизи­рованных ...
Added: October 31, 2019
Pragmatic Markers Distribution in Russian Everyday Speech: Frequency Lists and Other Statistics for Discourse Modeling
Богданова-Бегларян Н. В., Sherstinova T., Blinova O. V. et al., , in: Speech and Computer. 21st International Conference, SPECOM 2019, Istanbul, Turkey, August 20–25, 2019, ProceedingsVol. 11658.: Switzerland: Springer, 2019. P. 433–443.
Pragmatic markers (PMs) are discourse units (words and multiword expressions) with a weakened referential meaning, which perform a variety of pragmatic tasks. For example, in English the common PMs are “well”, “you know”, “I think”, and many others. PMs are integral elements of spoken discourse in every language. According to the results obtained from the ...
Added: October 29, 2019
Аннотирование прагматических маркеров в русском речевом корпусе: проблемы, поиски, решения, результаты
Богданова-Бегларян Н. В., Blinova O. V., Sherstinova T. et al., Компьютерная лингвистика и интеллектуальные технологии 2019 № 18 С. 72–85
В статье описывается опыт аннотирования прагматических маркеров (ПМ) в двух русских речевых корпусах: «Один речевой день» (ОРД; диалоги) и «Сбалансированная аннотированная текстотека» (САТ; монологи). Для подготовки сплошной разметки ПМ было проведено 4 пилотных аннотирования на выборках из ОРД и САТ, что позволило сформировать итоговый список ПМ: 450 единиц, представляющих собой варианты 53 базовых структурных типов. ...
Added: October 28, 2019
  • About
  • About
  • Key Figures & Facts
  • Sustainability at HSE University
  • Faculties & Departments
  • International Partnerships
  • Faculty & Staff
  • HSE Buildings
  • HSE University for Persons with Disabilities
  • Public Enquiries
  • Studies
  • Admissions
  • Programme Catalogue
  • Undergraduate
  • Graduate
  • Exchange Programmes
  • Summer University
  • Summer Schools
  • Semester in Moscow
  • Business Internship
  • Research
  • International Laboratories
  • Research Centres
  • Research Projects
  • Monitoring Studies
  • Conferences & Seminars
  • Academic Jobs
  • Yasin (April) International Academic Conference on Economic and Social Development
  • Media & Resources
  • Publications by staff
  • HSE Journals
  • Publishing House
  • iq.hse.ru: commentary by HSE experts
  • Library
  • Economic & Social Data Archive
  • Video
  • HSE Repository of Socio-Economic Information
  • HSE1993–2026
  • Contacts
  • Copyright
  • Privacy Policy
  • Site Map
Edit