• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • A
  • A
  • A
  • A
  • A
Обычная версия сайта
  • RU
  • EN
  • Национальный исследовательский университет «Высшая школа экономики»
  • Публикации ВШЭ
  • Статьи
  • Using TXM Platform for Research on Language Changes over Time: The Dynamics of Vocabulary and Punctuation in Russian Literary Texts
  • RU
  • EN
Расширенный поиск
Высшая школа экономики
Национальный исследовательский университет
Приоритетные направления
  • бизнес-информатика
  • государственное и муниципальное управление
  • гуманитарные науки
  • инженерные науки
  • компьютерно-математическое
  • математика
  • менеджмент
  • право
  • социология
  • экономика
по году
  • 2027
  • 2026
  • 2025
  • 2024
  • 2023
  • 2022
  • 2021
  • 2020
  • 2019
  • 2018
  • 2017
  • 2016
  • 2015
  • 2014
  • 2013
  • 2012
  • 2011
  • 2010
  • 2009
  • 2008
  • 2007
  • 2006
  • 2005
  • 2004
  • 2003
  • 2002
  • 2001
  • 2000
  • 1999
  • 1998
  • 1997
  • 1996
  • 1995
  • 1994
  • 1993
  • 1992
  • 1991
  • 1990
  • 1989
  • 1988
  • 1987
  • 1986
  • 1985
  • 1984
  • 1983
  • 1982
  • 1981
  • 1980
  • 1979
  • 1978
  • 1977
  • 1976
  • 1975
  • 1974
  • 1973
  • 1972
  • 1971
  • 1970
  • 1969
  • 1968
  • 1967
  • 1966
  • 1965
  • 1964
  • 1963
  • 1958
  • еще
Тематика
Новости
17 июня 2026 г.
Биоинформатики НИУ ВШЭ обнаружили 20 опасных мутаций в гене, связанном с легочной артериальной гипертензией
Ученые НИУ ВШЭ совместно с коллегами из российских университетов выяснили, какие мутации в гене ACVRL1 опасны для пациентов с легочной артериальной гипертензией. Они смоделировали, как изменения в гене влияют на связывание АТФ с белком — процесс, от которого зависит передача сигналов, необходимых для работы сосудов. Оказалось, что 20 из 32 вариантов могут нарушать передачу сигнала и провоцировать болезнь. Результаты опубликованы в Journal of Structural Biology.
17 июня 2026 г.
Интеллектуальная робототехника: кадровый голод и масса возможностей
Пока на рынке мало кадров, способных заниматься разработкой интеллектуальных робототехнических систем. Между тем именно к этому идет робототехника. Как учат ее проектированию и каково будущее отрасли, в интервью IQ Media рассказал заведующий Проектно-учебной лабораторией робототехники НИУ ВШЭ Вадим Моргачев.
17 июня 2026 г.
Каким должно быть образование, чтобы готовить кадры для экономики будущего
Эти вопросы обсудят на форуме HR EXPO PRO ЛЮДЕЙ, который состоится 18-19 июня в Москве. В его работе примет участие ректор НИУ ВШЭ Никита Анисимов, федеральные министры, HR-директора компаний, ректоры вузов, эксперты. На форуме будет представлен стенд, посвященный программам ДПО НИУ ВШЭ.

 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!

Публикации
  • Книги
  • Статьи
  • Главы в книгах
  • Препринты
  • Верификация публикаций
  • Расширенный поиск
  • Правила использования материалов
  • Наука в ВШЭ

?

Using TXM Platform for Research on Language Changes over Time: The Dynamics of Vocabulary and Punctuation in Russian Literary Texts

Vestnik Tomskogo Gosudarstvennogo Universiteta, Filologiya. 2021. Vol. 70. P. 69–89.
Lavrentiev A. M., Шерстинова Т. Ю., Чеповский А. М., Pincemin B.

The purpose of this paper is to test the methodological tools provided by TXM platform for research on dynamics of vocabulary and punctuation marks in diachronic corpora. TXM is a powerful text analysis software which provides both quantitative and qualitative features in a transparent open-source implementation. In this paper, we demonstrate how it can be used for diachronic text research which takes into account some external factors affecting the evident language shifts. The study was conducted on the corpus of Russian Short Stories of the first third of the 20th century. This corpus aims for collecting texts written by the maximum number of Russian writers; it is designed by its developers to become a testing ground for various text computation techniques. The results of this preliminary study show the efficacy of TXM application for research on language dynamics and confirm an obvious chronological trend in the distribution of texts under study. Thus, it was shown that Russian revolution of 1917 did make significant changes in the core vocabulary of prose language understood as well as in the use of punctuation marks. However, no evident opposition was revealed at this level between the war and peace time periods. The methodology presented in this paper may be used both for diachronic studies of literature and for various NLP tasks connected with texts processing and monitoring over time with the aim of revealing linguistic, stylistic and sentiment changes in texts influenced  by some external factors.

Научное направление: Филология и лингвистика Компьютерные науки
Приоритетные направления: гуманитарные науки компьютерно-математическое
Язык: английский
Полный текст
DOI
Ключевые слова: корпусная лингвистикаvocabularycorpus linguisticsдиахроническая лингвистикастилеметрияtextometrydiachronic linguisticsтекстометрия
Похожие публикации
Зачем нужен поэтический корпус и как его использовать
Корчагин К. М., Русская речь 2019 Т. 6 С. 113–127
Поэтический корпус в составе Национального корпуса русского языка — инструмент для исследователей русской поэзии и поэтическо го языка. Корпус содержит обширную коллекцию русской поэзии XVIII ХХ веков, отражает все заметные поэтические направления и продол жает пополняться. В нем присутствуют два типа разметки — граммати ческая и стиховедческая. Если первая совпадает с разметкой в основ ном ...
Добавлено: 19 июня 2026 г.
Бьяджо Гарофало и дискуссии о «естественном порядке слов» в Европе XVII-XVIII вв.
Шумилин М. В., Индоевропейское языкознание и классическая филология 2026 Т. 30 № 1 С. 769–790
В статье предлагается уточнение интерпретации трактата Бьяджо Гарофало «Соображения по поводу поэзии евреев и греков» (Considerazioni intorno alla poesia degli Ebrei, e de i Greci, 1707), вписывающее его в контекст европейских дискуссий XVII–XVIII в. о «естественном порядке слов». Чаще трактат рассматривают исключительно как реплику о метрической природе древнееврейской поэзии, однако, как показано в статье более ...
Добавлено: 18 июня 2026 г.
In orationes Ciceronis emendatiunculae
Шумилин М. В., Hyperboreus 2026 Vol. 32 No. 1 P. 98–105
В статье предлагается набор эмендаций к речам Цицерона. В много обсуждавшемся месте Pro Archia 28 предлагается вместо рукописного (ad)(h)ortaui читать aduocaui. В Pro Caelio 18 вместо парадосиса liceret предлагается читать liceat. В Pro Ligario 24 дается рекомендация читать Quamquam <quid>, quid facturi fueritis, dubitem... В Philippicae 2. 69 предлагается удалить слово exegit. ...
Добавлено: 18 июня 2026 г.
Графовые паттерны в несогласованных декларативных моделях процессов
Анненков А. Н., Нестеров Р. А., Моделирование и анализ информационных систем 2026 Т. 33 № 2 С. 176–205
Декларативные модели процессов широко используются в process mining для гибкого описания поведения процессов с помощью наборов ограничений. Однако модели, автоматически извлекаемые из журналов событий, могут содержать несогласованные ограничения, что затрудняет их интерпретацию и делает их непригодными для исполнения, проверки соответствия или дальнейшего анализа. Существующие методы анализа согласованности либо опираются на автоматные конструкции с высокой асимптотической сложностью ...
Добавлено: 18 июня 2026 г.
Advances in Information Retrieval: 48th European Conference on Information Retrieval, ECIR 2026, Delft, The Netherlands, March 29 – April 2, 2026, Proceedings, Part II
Cham: Springer Publishing Company, 2026.
Добавлено: 18 июня 2026 г.
Искусственный интеллект как роза научной деятельности: исследование Тимоти Гауэрса
Поддьяков А. Н., Троицкий вариант. Наука 2026 № 12 С. 24–25
В научно-популярной заметке представлен обзор содержания поста филдсовского медалиста Тимоти Гауэрса о возможностях ИИ в математике и содержания комментариев под постом. Обзор сделан в основном чат-ботом DeepSeek. В заключение обсуждается возможность не только решения задач искусственным интеллектом, но и их постановки. ...
Добавлено: 18 июня 2026 г.
Exploring New Frontiers in Vertical Federated Learning: the Role of Saddle Point Reformulation
Beznosikov A., Kormakov G., Grigorievskiy A. и др., Journal of Optimization Theory and Applications 2026 Vol. 209 Article 18
Добавлено: 17 июня 2026 г.
Supervised Learning in Critical Phenomena—Statistical and Systematic Accuracy
Chertenkov V. I., Щур Л. Н., Lobachevskii Journal of Mathematics 2026 Vol. 47 No. 2 P. 720–727
Добавлено: 16 июня 2026 г.
Enhancing Emotion Recognition in Speech Based on Self-Supervised Learning: Cross-Attention Fusion of Acoustic and Semantic Features
Deeb B., Andrey V. Savchenko, Макаров И. А., IEEE Access 2026 Vol. 13 P. 56283–56295
Добавлено: 16 июня 2026 г.
Automated detection of wolf howls using audio spectrogram transformers
Makarov N., Савченко А. В., Zemtsova I. и др., Scientific Reports 2025 Vol. 15 Article 26641
Добавлено: 16 июня 2026 г.
Artificial intelligence framework for multi-pathology risk assessment from retinal fundus images: deep learning approach to 15-disease screening
Vasilev R., Савченко А. В., Blinov P. и др., Frontiers in Medicine 2026 Vol. 13
Добавлено: 16 июня 2026 г.
From Data to Signs: A Foundation Model for Multilingual Sign Language Recognition
Novopoltsev M., Tulenkov A., Murtazin R. и др., IEEE Access 2025 Vol. 13 P. 188170–188181
Добавлено: 16 июня 2026 г.
Актуальные проблемы теоретической и прикладной лингвистики: опыт молодых исследователей. Cборник научных статей.
СПб.: Санкт-Петербургский государственный экономический университет, 2024.
Сборник научных статей подготовлен на кафедре английской филологии и перевода гуманитарного факультета Санкт-Петербургского государственного экономического университета. Он содержит исследования по актуальным проблемам современного языкознания, которые отражают современные тенденции развития науки о языке и присущую ей междис-циплинарность. Сборник адресован студентам, магистрантам, аспирантам и специалистам в области языкознания, а также широкому кругу читателей, интересующихся проблемами современной лингвистики. ...
Добавлено: 16 июня 2026 г.
B3Emo: Quantifying Affect as a Double-Edged Sword in Strategic LLM Interactions
Stepin A., Mozikov M., Kabanov A. и др., IEEE Access 2026 Vol. 14 P. 48127–48144
Добавлено: 16 июня 2026 г.
ESQA: Event Sequences Question Answering
Abdullaeva I., Karpukhin I., Filatov A. и др., IEEE Access 2026 Vol. 14 P. 59390–59408
Добавлено: 16 июня 2026 г.
Female aging in Eastern European advertising: semiosis, representation, reinterpretation
Запорожцева Л. Е., Semiotica 2026 P. 1–20
Добавлено: 16 июня 2026 г.
Русские тексты рубежа XVII–XVIII вв. в немецком издании «Травника» Маттиоли (Prag, 1563)
Лифшиц А. Л., Святохина Е. В., Одиссей: Человек в истории 2026 № 1 С. 156–173
Статья вводит в научный оборот новый источник по истории русского языка, науки и культуры конца XVII в. Многочисленные русские подписи к гравюрам были обнаружены в экземпляре «Травника» великого ренессансного ботаника и фармацевта Пьетро Андреа Маттиоли, изданного в Праге на немецком языке в 1563 г. Кроме транслитерации латинских названий, книга содержит чрезвычайно значительное число славянских фитонимов, ...
Добавлено: 15 июня 2026 г.
Дрожащие огни: что видел Лермонтов?
Лифшиц А. Л., Живая старина 2026 № 2 (130) С. 38–40
В заметке делается попытка увидеть ночной пейзаж глазами автора текста, давно ставшего школьной классикой. Традиционная интерпретация приписывает стихотворению народность, которой Лермонтов, вероятно, не имел в виду. Сопоставление с современными поэту текстами показывает, что родина Лермонтова не крестьянская, а мелкопоместная Россия степных губерний. ...
Добавлено: 15 июня 2026 г.
Колебания в употреблении протоартикля при одушевленных функциональных именах в готском языке и проблема «анафорической стадии» грамматикализации артикля
Пименова Н. Б., Индоевропейское языкознание и классическая филология 2026 Т. 30 № 2 С. 313–322
В статье анализируются некоторые примеры непоследовательного употребления анафорического артикля в готском языке (IV в. н.э., восточногерманская группа), который считается классическим примером языка, находящегося на первой, анафорической стадии грамматикализации артикля. Помимо описанных в литературе нарушений анафорического правила: контекстов с локативными именами и обозначениями ‘множества’ одушевленных лиц, — мы можем фиксировать неоднократные колебания артикля при именах berusjos, ...
Добавлено: 15 июня 2026 г.
A Note on the Qumran Version of Isa 5:18
von Büttner Сyrill, Textus 2024 No. 32/2 P. 156–167
Добавлено: 15 июня 2026 г.
Proceedings of the 19th Conference of the European Chapter of the Association for Computational Linguistics (Volume 1: Long Papers)
Association for Computational Linguistics, 2026.
Добавлено: 14 июня 2026 г.
Syntactic functions of non-manuals in Russian Sign Language
Burkova S., Khristoforova E., Kimmelman V., , in: Advances in Sign Language Corpus Linguistics.: John Benjamins Publishing Company, 2023. P. 90–129.
Добавлено: 3 июня 2026 г.
Система синтаксических инвариантов текстовой деятельности: статистические дескрипторы, семантическая структура и диагностические профили
Кудрявцева Е. И., / РЦИС. Серия № 0148-756-286. 2026.
Содержанием работы является система идентификации четырех типов письменно-речевых структур. Совокупность 11 расчетных параметров, статистических эталонов и семантических характеристик позволяют идентифицировать структуру текста как результат определенной когнитивной схемы (сцена, событие, история, оценка). Метод верифицирован на репрезентативной выборке (N=3900+) и базируется на выявлении критического порогового значения коэффициента подчиненности. Также математически верифицированы переходы между типами: от атомарной фиксации объекта ...
Добавлено: 2 июня 2026 г.
Почему растущие доходы не делают людей счастливее: эмоциональное объяснение парадокса Истерлина (Why Growing Incomes Do Not Make People Happier: an Emotional Explanation of the Easterlin Paradox)
Ворчик А. Д., / SSRN. Серия Social Science Research Network "Social Science Research Network". 2026.
Эта работа посвящена теоретическому объяснению парадокса Истерлина, согласно которому долгосрочный экономический рост не приводит к росту среднего уровня счастья людей. Под счастьем мы понимаем интенсивность эмоций, которые люди испытывают, когда сравнивают свой новый доход с ожидаемым либо целевой - с изначальным. В первом случае мы имеем дело с реактивным подходом к росту, тогда как во втором ...
Добавлено: 31 мая 2026 г.
  • О ВЫШКЕ
  • Цифры и факты
  • Руководство и структура
  • Устойчивое развитие в НИУ ВШЭ
  • Преподаватели и сотрудники
  • Корпуса и общежития
  • Закупки
  • Обращения граждан в НИУ ВШЭ
  • Фонд целевого капитала
  • Противодействие коррупции
  • Сведения о доходах, расходах, об имуществе и обязательствах имущественного характера
  • Сведения об образовательной организации
  • Людям с ограниченными возможностями здоровья
  • Единая платежная страница
  • Работа в Вышке
  • ОБРАЗОВАНИЕ
  • Лицей
  • Довузовская подготовка
  • Олимпиады
  • Прием в бакалавриат
  • Вышка+
  • Прием в магистратуру
  • Аспирантура
  • Дополнительное образование
  • Центр развития карьеры
  • Бизнес-инкубатор ВШЭ
  • Образовательные партнерства
  • Обратная связь и взаимодействие с получателями услуг
  • НАУКА
  • Научные подразделения
  • Исследовательские проекты
  • Мониторинги
  • Диссертационные советы
  • Защиты диссертаций
  • Академическое развитие
  • Конкурсы и гранты
  • Внешние научно-информационные ресурсы
  • РЕСУРСЫ
  • Библиотека
  • Издательский дом ВШЭ
  • Книжный магазин «БукВышка»
  • Типография
  • Медиацентр
  • Журналы ВШЭ
  • Публикации
  • http://www.minobrnauki.gov.ru/
    Министерство науки и высшего образования РФ
  • https://edu.gov.ru/
    Министерство просвещения РФ
  • http://www.edu.ru
    Федеральный портал «Российское образование»
  • https://elearning.hse.ru/mooc
    Массовые открытые онлайн-курсы
  • НИУ ВШЭ1993–2026
  • Адреса и контакты
  • Условия использования материалов
  • Политика конфиденциальности
  • Правила применения рекомендательных технологий в НИУ ВШЭ
  • Карта сайта
Редактору