Referential Choice: Factors and Modeling

M. Khudyakova; Kibrik A.; Dobrov G.; Linnik A.

?

Referential Choice: Factors and Modeling

P. 16–20.

Худякова М. В., Kibrik A., Dobrov G., Linnik A.

Referential choice is the process of selecting an appropriate referential expression for a referent that the speaker/writer intends to mention at some point in discourse. Referential choice is governed by the referent's current status in the speaker's/writer's working memory. This status, in turn, is determined by a number of factors, rooted in discourse context and referent's properties. Activation in working memory is immediately responsible for the coarse choice between full and reduced referential devices, which is the high level distinction in the hierarchical organization of referential choice. Lower levels of granularity correspond to the choice between proper names and description, and still more refined options. Referential choice is a multi-factorial process. We have created a corpus of written texts in which many potentially relevant factors of referential choice are annotated. We also use another corpus in which the same texts are annotated for discourse structure, as it is known that rhetorical distance, measured on the basis of hierarchical discourse structure, is a powerful factor of referential choice. We have modeled referential choice in the corpus with the help of a variety of machine learning algorithms. The accuracy of prediction for the choice between full and reduced referential devices is close to 90%, and for the three-way choice between pronouns, descriptions, and proper names it is close to 80%. We experimented with the reduction of the set of factors and explored the phenomenon of non-categorical that is probabilistic, referential choice.

Язык: английский

Ключевые слова: corpus linguistics referential choice Cognitive Linguistics

В книге

LATEUM 2013. Conference Proceedings. ELT and Linguistics 2013: New Strategies for Better Solutions

M.: Max press, 2013.

Российская социология в условиях цифровизации общества: результаты анализа корпуса научных текстов

Смирнов А. В., Социологические исследования 2023 № 4 С. 39–50

На массиве публикаций из восьми ведущих социологических журналов за период с 2000 по 2021 г. методами анализа текстов изучаются особенности влияния цифровизации общества на социологию. Частотный анализ 13,8 тыс. научных текстов позволил отследить введение в научный оборот концептов, связанных с цифровизацией. Выявлялись различия между журналами. Изучался опыт использования цифровых социальных платформ в качестве источника данных и ...

Добавлено: 18 марта 2026 г.

Promotional adjectives in grant proposal abstracts: a corpus study

Dmitriy S. Tulyakov, Tatiana M. Permyakova, Ekaterina A. Balezina, Вестник Волгоградского государственного университета. Серия 2: Языкознание 2025 Vol. 24 No. 6 P. 58–67

Эффективно интегрируя дискурс продвижения в аннотации заявок на гранты, исследователи могут более убедительно представить свои идеи и повысить шансы на получение финансирования. Частотность использования прилагательных продвижения при написании заявок на гранты может отличаться в разных областях исследований. В данной статье рассматривается употребление прилагательных продвижения в аннотациях заявок на гранты в шести научных сферах. Основная гипотеза ...

Добавлено: 2 марта 2026 г.

Динамика восприятия площадей в пространстве города носителями русского языка (сравнительный анализ по данным НКРЯ)

Белова П. Е., В кн.: Актуальные вопросы лингвистики и литературоведения: сборник научных статей по материалам международной научной конференции памяти доктора филологических наук, профессора Л.А. Араевой (6–8 февраля 2025).: Кемеровский государственный университет, 2025. С. 155–160.

В данной статье содержатся результаты исследования того, как в русской языковой кар-тине мира, начиная со второй половины XX века по настоящее время, менялось восприятие площадей в пространстве города. В ходе обращения к подкорпусу художественных текстов второй половины XX века и XXI в. Национального корпуса русского языка были выявлены присущие рассматриваемому объекту когнитивные признаки, установлены предметно-понятийные ...

Добавлено: 4 февраля 2026 г.

Preposition drop in Russian spoken by Mari and Beserman bilinguals

Яковлева А. В., Kosheliuk N., Мороз Г. А., International Journal of Bilingualism 2025 P. 1–19

Добавлено: 26 ноября 2025 г.

Вариативность годов vs. лет в русских говорах: корпусное исследование

Земичева С. С., Мороз Г. А., Наккарато М. К., Вопросы языкознания 2025 № 6 С. 7–34

The presence of the genitive plural suppletive form let in the paradigm of the noun god ‘year’ distinguishes Russian from other East Slavic languages. In Russian dialects, instead of let, the dialect variant godov is sometimes used. Data from the panchronic subcorpus of the Russian National Corpus show that the form godov, which is first attested in the ...

Добавлено: 12 ноября 2025 г.

Automatic Annotation of Discourse and Speech Formulas in Internet Communication: A Telegram Comment Corpus

Maslenikova A., Tatiana I. Popova, , in: 27th International Conference, SPECOM 2025, Szeged, Hungary, October 13–15, 2025, Proceedings, Part I. Speech and Computer. Lecture Notes in Artificial Intelligence 16187Vol. 16187: Lecture Notes in Artificial Intelligence.: Springer, 2025. P. 278–292.

Добавлено: 19 октября 2025 г.

27th International Conference, SPECOM 2025, Szeged, Hungary, October 13–15, 2025, Proceedings, Part II. Speech and Computer. Lecture Notes in Artificial Intelligence 16188

Springer, 2025.

Добавлено: 19 октября 2025 г.

Psychological Applications Conference and Trends (InPACT 2022).

inScience Press, 2022.

Добавлено: 23 сентября 2025 г.

Variation in a Narrative Corpus of Mano and Kpelle: Contact-Induced or Not?.

Khachaturyan M., Konoshenko M., Мороз Г. А. и др., , in: N’yng-dyuumgu, n’yng-ngafq: Festschrift for Ekaterina GruzdevaVol. 126.: Helsinki: Studia Orientalia, 2025. P. 35–59.

Добавлено: 5 сентября 2025 г.

Переписка Н. С. Хрущева и Ф. Кастро периода Карибского кризиса: опыт компьютеризованного анализа

Герцен А. С., В кн.: Четвёртая зимняя школа по гуманитарной информатике.: Балтийский федеральный университет им. Иммануила Канта, 2020. С. 92–97.

Проанализированы письма первого секретаря ЦК КПСС и председателя Совета министров СССР Н.С. Хрущева и премьер-министра Кубы Ф. Кастро Руса, написанные с 26 по 31 октября 1962 г. на тему Карибского кризиса и размещенные на кубинском сайте «Fidel. Soldado de las ideas» (http://www.fidelcastro.cu/es). Цель исследования — выявить общие черты и различия в восприятии и оценках исторического ...

Добавлено: 15 июля 2025 г.

An overview of morphosyntactic variation in the speech of Russian-Chuvash bilinguals: number, gender, case assignment and preposition drop

Гришанова А. Ю., Russian linguistics 2025 Vol. 49 Article 10

Цель данного исследования – описание морфосинтаксической вариативности и детальный анализ явления выпадения предлогов в русской речи чувашских билингвов. В частности, исследуется, какие факторы могут обусловливать эту вариативность. Чтобы рассмотреть морфосинтаксические особенности, был проведен качественный анализ данных, извлеченных из корпуса русской речи Чувашии. Было также проведено количественное исследование явления выпадения предлогов с использованием всех 2529 предложных ...

Добавлено: 10 июля 2025 г.

Do Formal Stance Strategies Reveal Disciplinary Variation in Professional Scientific Writing?

Смирнова Е. А., Pérez-Guerra J., International Journal of Applied Linguistics 2025 Vol. 35 No. 3 P. 1242–1261

Добавлено: 10 апреля 2025 г.

Русский язык в условиях контактирования: тюркско-русское языковое взаимодействие. Часть 1. Социолингвистическое и корпусное исследование

Резанова З. И., Артёменко Е. Д., Диброва В. С. и др., Томск: Издательство Томского государственного университета, 2024.

В монографии представлены собственно лингвистические, социолингвистические и психолингвистические аспекты взаимодействия русского и трех тюркских языков – шорского, хакасского, татарского (сибирского варианта). Охарактеризованы варианты влияния тюркских языков на речевую практику и когнитивные процессы порождения и восприятия речи русскоязычными билингвами. Представлены методики сбора данных, их обработки при формировании социолингвистической базы данных и морфологически размеченного бимодального корпуса русской устной речи билингвов, ...

Добавлено: 7 апреля 2025 г.

The ‘adverb-ly adjective’ construction in English: meanings, distribution and discourse functions

Taboada M., Goddard C., Трнавац Р., English Language and Linguistics 2025 Vol. 29 No. 1 P. 102–131

Добавлено: 4 апреля 2025 г.

Creation and Analysis of the Multimedia Russian Corpus for Gesture Research

Рахилина Е. В., Cienki A., , in: The Cambridge Handbook of Gesture Studies.: Cambridge University Press, 2024. P. 249–272.

Добавлено: 13 февраля 2025 г.

Non-standard numeral constructions in L2 Russian: A corpus-based study

Наккарато М. К., Мороз Г. А., International Journal of Bilingualism 2026 Vol. 30 No. 2 P. 358–379

Добавлено: 24 января 2025 г.

ИСПОЛЬЗОВАНИЕ МЕТОДОВ КОМПЬЮТЕРНОЙ ЛИНГВИСТИКИ ДЛЯ АНАЛИЗА ЛИТЕРАТУРЫХ ТЕКСТОВ

Аванесян Н. Л., Фокина А. И., Чеповский А. М., В кн.: Инжиниринг предприятий и управление знаниями (ИП&УЗ-2024) : сборник научных трудов XXVII Российской научной конференции. 28–29 ноября 2024 г. / под науч. ред. Ю. Ф. Тельнова. – Москва : ФГБОУ ВО «РЭУ им. Г. В. Плеханова», 2024.: М.: ФГБОУ ВО "РЭУ им. Г.В. Плеханова", 2024. С. 15–18.

Статья посвящена применению математических методов корпусного анализа для исследований литературных текстов. На примере созданных корпусов продемонстрированы возможности применения метода анализа соответствий и анализ коэффициентов попарной ранговой корреляции для сравнения частотных характеристик текстов различных подкорпусов. Описанные методики дают коррелированные результаты. Они могут использоваться как для лингвистических исследований, так и создания корректных обучающих текстовых наборов для задач искусственного интеллекта. ...

Добавлено: 19 декабря 2024 г.

Корпусная лингвистика на современном этапе

Плунгян В. А., Вестник Российской академии наук 2024 Т. 94 № 9 С. 787–794

Даётся общее представление о корпусной лингвистике, её истории, методах и влиянии на современные представления об изучении языка, которое обычно обозначается как “корпусная революция”. ...

Добавлено: 16 декабря 2024 г.

Популистский текст как объект корпусного исследования

Галочкин А. Е., В кн.: ЧЕЛОВЕК В СИСТЕМЕ КОММУНИКАЦИЙ: ПРОФЕССИОНАЛЬНЫЕ КОММУНИКАЦИИ В ЦИФРОВУЮ ЭПОХУ.: Нижегородский государственный лингвистический университет им. Н.А. Добролюбова, 2023. С. 87–90.

В данной статье рассматривается феномен популизма в контексте методов корпусной лингвистики, который приобретает особую значимость в современном мире. Актуальность данного исследования связана с ростом правого популизма в странах Европы и важностью понимания механизмов популистского дискурса. В статье анализируются исследования, направленные на эмпирическое измерение популизма и выявление языковых особенностей при помощи корпусно-ориентированного подхода. ...

Добавлено: 16 ноября 2024 г.

Коньячку бы, да до дому: хронология развития некоторых форм второго родительного падежа

Буденная Е. В., Труды института русского языка им. В.В. Виноградова 2024 № 2(40) С. 261–282

В статье на материале Национального корпуса русского языка (НКРЯ) исследуется диахроническое развитие конструкций со вторым родительным падежом (флексия -у) в трех типах контекстов: 1) конструкции с именными квантификаторами; 2) конструкции с предлогом без; 3) конструкции с предлогом до. Также данные русского языка сравниваются с данными других языков (прибалтийско-финских, некоторых тюркских), в которых присутствует тенденция к ...

Добавлено: 4 октября 2024 г.