• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • A
  • A
  • A
  • A
  • A
Обычная версия сайта
  • RU
  • EN
  • Национальный исследовательский университет «Высшая школа экономики»
  • Публикации ВШЭ
  • Статьи
  • Using TXM Platform for Research on Language Changes over Time: The Dynamics of Vocabulary and Punctuation in Russian Literary Texts
  • RU
  • EN
Расширенный поиск
Высшая школа экономики
Национальный исследовательский университет
Приоритетные направления
  • бизнес-информатика
  • государственное и муниципальное управление
  • гуманитарные науки
  • инженерные науки
  • компьютерно-математическое
  • математика
  • менеджмент
  • право
  • социология
  • экономика
по году
  • 2027
  • 2026
  • 2025
  • 2024
  • 2023
  • 2022
  • 2021
  • 2020
  • 2019
  • 2018
  • 2017
  • 2016
  • 2015
  • 2014
  • 2013
  • 2012
  • 2011
  • 2010
  • 2009
  • 2008
  • 2007
  • 2006
  • 2005
  • 2004
  • 2003
  • 2002
  • 2001
  • 2000
  • 1999
  • 1998
  • 1997
  • 1996
  • 1995
  • 1994
  • 1993
  • 1992
  • 1991
  • 1990
  • 1989
  • 1988
  • 1987
  • 1986
  • 1985
  • 1984
  • 1983
  • 1982
  • 1981
  • 1980
  • 1979
  • 1978
  • 1977
  • 1976
  • 1975
  • 1974
  • 1973
  • 1972
  • 1971
  • 1970
  • 1969
  • 1968
  • 1967
  • 1966
  • 1965
  • 1964
  • 1963
  • 1958
  • еще
Тематика
Новости
17 июня 2026 г.
Интеллектуальная робототехника: кадровый голод и масса возможностей
Пока на рынке мало кадров, способных заниматься разработкой интеллектуальных робототехнических систем. Между тем именно к этому идет робототехника. Как учат ее проектированию и каково будущее отрасли, в интервью IQ Media рассказал заведующий Проектно-учебной лабораторией робототехники НИУ ВШЭ Вадим Моргачев.
17 июня 2026 г.
Каким должно быть образование, чтобы готовить кадры для экономики будущего
Эти вопросы обсудят на форуме HR EXPO PRO ЛЮДЕЙ, который состоится 18-19 июня в Москве. В его работе примет участие ректор НИУ ВШЭ Никита Анисимов, федеральные министры, HR-директора компаний, ректоры вузов, эксперты. На форуме будет представлен стенд, посвященный программам ДПО НИУ ВШЭ.
16 июня 2026 г.
Публичность ученого: идеальная мера
Еще недавно публичность для ученого считалась чем-то факультативным – полезным, но необязательным. Сегодня она все чаще встроена в научную работу. Не потому, что «надо быть в медиа», а потому что без внешней проявленности исследования могут просто не найти ни аудитории, ни партнеров, ни продолжения. Об этом в статье для IQ Media размышляет эксперт по научным коммуникациям, доцент факультета географии Высшей школы экономики Надежда Пупышева.

 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!

Публикации
  • Книги
  • Статьи
  • Главы в книгах
  • Препринты
  • Верификация публикаций
  • Расширенный поиск
  • Правила использования материалов
  • Наука в ВШЭ

?

Using TXM Platform for Research on Language Changes over Time: The Dynamics of Vocabulary and Punctuation in Russian Literary Texts

Vestnik Tomskogo Gosudarstvennogo Universiteta, Filologiya. 2021. Vol. 70. P. 69–89.
Lavrentiev A. M., Шерстинова Т. Ю., Чеповский А. М., Pincemin B.

The purpose of this paper is to test the methodological tools provided by TXM platform for research on dynamics of vocabulary and punctuation marks in diachronic corpora. TXM is a powerful text analysis software which provides both quantitative and qualitative features in a transparent open-source implementation. In this paper, we demonstrate how it can be used for diachronic text research which takes into account some external factors affecting the evident language shifts. The study was conducted on the corpus of Russian Short Stories of the first third of the 20th century. This corpus aims for collecting texts written by the maximum number of Russian writers; it is designed by its developers to become a testing ground for various text computation techniques. The results of this preliminary study show the efficacy of TXM application for research on language dynamics and confirm an obvious chronological trend in the distribution of texts under study. Thus, it was shown that Russian revolution of 1917 did make significant changes in the core vocabulary of prose language understood as well as in the use of punctuation marks. However, no evident opposition was revealed at this level between the war and peace time periods. The methodology presented in this paper may be used both for diachronic studies of literature and for various NLP tasks connected with texts processing and monitoring over time with the aim of revealing linguistic, stylistic and sentiment changes in texts influenced  by some external factors.

Научное направление: Филология и лингвистика Компьютерные науки
Приоритетные направления: гуманитарные науки компьютерно-математическое
Язык: английский
Полный текст
DOI
Ключевые слова: корпусная лингвистикаvocabularycorpus linguisticsдиахроническая лингвистикастилеметрияtextometrydiachronic linguisticsтекстометрия
Похожие публикации
Female aging in Eastern European advertising: semiosis, representation, reinterpretation
Запорожцева Л. Е., Semiotica 2026 P. 1–20
Добавлено: 16 июня 2026 г.
Русские тексты рубежа XVII–XVIII вв. в немецком издании «Травника» Маттиоли (Prag, 1563)
Лифшиц А. Л., Святохина Е. В., Одиссей: Человек в истории 2026 № 1 С. 156–173
Статья вводит в научный оборот новый источник по истории русского языка, науки и культуры конца XVII в. Многочисленные русские подписи к гравюрам были обнаружены в экземпляре «Травника» великого ренессансного ботаника и фармацевта Пьетро Андреа Маттиоли, изданного в Праге на немецком языке в 1563 г. Кроме транслитерации латинских названий, книга содержит чрезвычайно значительное число славянских фитонимов, ...
Добавлено: 15 июня 2026 г.
Дрожащие огни: что видел Лермонтов?
Лифшиц А. Л., Живая старина 2026 № 2 (130) С. 38–40
В заметке делается попытка увидеть ночной пейзаж глазами автора текста, давно ставшего школьной классикой. Традиционная интерпретация приписывает стихотворению народность, которой Лермонтов, вероятно, не имел в виду. Сопоставление с современными поэту текстами показывает, что родина Лермонтова не крестьянская, а мелкопоместная Россия степных губерний. ...
Добавлено: 15 июня 2026 г.
Колебания в употреблении протоартикля при одушевленных функциональных именах в готском языке и проблема «анафорической стадии» грамматикализации артикля
Пименова Н. Б., Индоевропейское языкознание и классическая филология 2026 Т. 30 № 2 С. 313–322
В статье анализируются некоторые примеры непоследовательного употребления анафорического артикля в готском языке (IV в. н.э., восточногерманская группа), который считается классическим примером языка, находящегося на первой, анафорической стадии грамматикализации артикля. Помимо описанных в литературе нарушений анафорического правила: контекстов с локативными именами и обозначениями ‘множества’ одушевленных лиц, — мы можем фиксировать неоднократные колебания артикля при именах berusjos, ...
Добавлено: 15 июня 2026 г.
A Note on the Qumran Version of Isa 5:18
von Büttner Сyrill, Textus 2024 No. 32/2 P. 156–167
Добавлено: 15 июня 2026 г.
Proceedings of the 19th Conference of the European Chapter of the Association for Computational Linguistics (Volume 1: Long Papers)
Association for Computational Linguistics, 2026.
Добавлено: 14 июня 2026 г.
Идеологема «искусственный интеллект» в образе сильного государства (по материалам российского и китайского медиадискурсов)
Романова Т. В., Бинштейн М. М., Медиалингвистика 2026 Т. 13 № 1 С. 28–50
В данной статье противопоставляется узкое и широкое понимание содержание термина ИИ, фиксируется история его появления. Функционирование термина ИИ рассматривается  в сопоставительном аспекте по данным российских и китайских медийных источников: ...
Добавлено: 14 июня 2026 г.
Proceedings of the 6th Workshop on Computational Approaches to Discourse, Context and Document-Level Inferences (CODI 2025)
Strube M., Braud C., Hardmeier C. и др., Suzhou: Association for Computational Linguistics, 2025.
Добавлено: 11 июня 2026 г.
Самосознание в зеркале метафоры: квантитативный анализ метафорической системы раннего творчества Уоллеса Стивенса (1879–1955)
Чихачева Д. В., Человек: образ и сущность. Гуманитарные аспекты 2026 № 2 С. 217–228
Данное исследование фокусируется на раннем периоде творчества американского поэта Уоллеса Стивенса. Проведенный квантитативный анализ позволил определить доминанты метафорической системы этого периода творчества. Было установлено, что центральным смыслообразующим концептом в метафорике раннего творчества У. Стивенса выступает «СУЩЕСТВО». Исследование показывает, что поэтическая картина мира автора в этот период характеризуется тотальным панвитализмом – У. Стивенс наделяет атрибутами субъектности ...
Добавлено: 11 июня 2026 г.
TreeDQN: Sample-efficient off-policy reinforcement learning for combinatorial optimization
Sorokin D., Kostin A., Савченко Л. В. и др., Knowledge-Based Systems 2026 Vol. 348 Article 116258
Добавлено: 10 июня 2026 г.
Microbial diversity and production of milk spirit using traditional Buryat fermentation and distillation technologies
Namsaraev Z., Nanzatov B., Козлова А. Д. и др., Scientific Reports 2026 Vol. 16 No. 1 Article 17769
Дистиллированные кисломолочные напитки встречаются в пищевой промышленности редко, несмотря на повсеместное распространение растительных спиртных напитков. В настоящее время производство крепких дистиллированных алкогольных напитков из кисломолочных продуктов с использованием традиционных технологий известно лишь среди монголоязычных народов и их сибирских соседей. Данное исследование представляет собой первый междисциплинарный анализ дарасуна, традиционного бурятского спиртного напитка, изготавливаемого из кисломолочного напитка ...
Добавлено: 10 июня 2026 г.
«Увидел он гордеца павшим…» Мятеж Амасиса против Априя и египетский поход Навуходоносора II в древней и средневековой традиции
Ладынин И. А., Немировский А. А., Банщикова А. А. и др., М.: Издательство «Альма Матер», 2026.
В коллективной монографии подробно анализируются источники, связанные с предысторией, ходом и последствиями малоизвестного эпизода истории древнего Египта и Ближнего Востока – узурпации власти в Египте военачальником Амасисом у царя XXVI династии Априя (570-567 гг. до н.э.) и вмешательства в их противостояние вавилонского царя Навуходоносора II (567 г. до н.э.). Рассматривается значимость этого эпизода в восприятии ...
Добавлено: 10 июня 2026 г.
Artificial intelligence and digital twins for failure prediction in data center cooling systems: a comprehensive literature review (2018–2026)
Butorova A., Bobakov V., Sergeev A. и др., European Physical Journal: Special Topics 2026 P. 1–19
Добавлено: 10 июня 2026 г.
Syntactic functions of non-manuals in Russian Sign Language
Burkova S., Khristoforova E., Kimmelman V., , in: Advances in Sign Language Corpus Linguistics.: John Benjamins Publishing Company, 2023. P. 90–129.
Добавлено: 3 июня 2026 г.
Система синтаксических инвариантов текстовой деятельности: статистические дескрипторы, семантическая структура и диагностические профили
Кудрявцева Е. И., / РЦИС. Серия № 0148-756-286. 2026.
Содержанием работы является система идентификации четырех типов письменно-речевых структур. Совокупность 11 расчетных параметров, статистических эталонов и семантических характеристик позволяют идентифицировать структуру текста как результат определенной когнитивной схемы (сцена, событие, история, оценка). Метод верифицирован на репрезентативной выборке (N=3900+) и базируется на выявлении критического порогового значения коэффициента подчиненности. Также математически верифицированы переходы между типами: от атомарной фиксации объекта ...
Добавлено: 2 июня 2026 г.
Почему растущие доходы не делают людей счастливее: эмоциональное объяснение парадокса Истерлина (Why Growing Incomes Do Not Make People Happier: an Emotional Explanation of the Easterlin Paradox)
Ворчик А. Д., / SSRN. Серия Social Science Research Network "Social Science Research Network". 2026.
Эта работа посвящена теоретическому объяснению парадокса Истерлина, согласно которому долгосрочный экономический рост не приводит к росту среднего уровня счастья людей. Под счастьем мы понимаем интенсивность эмоций, которые люди испытывают, когда сравнивают свой новый доход с ожидаемым либо целевой - с изначальным. В первом случае мы имеем дело с реактивным подходом к росту, тогда как во втором ...
Добавлено: 31 мая 2026 г.
ML-based Fast Simulation of FARICH Responses
Шипилов Ф. А., Barnyakov A., Ivanov A. и др., / Series Physics "arxiv.org". 2026.
Добавлено: 19 мая 2026 г.
Focus on vocabulary. Экономика материальных и нематериальных активов: корпусный словарь и ИИ-упражнения по английскому языку
Горина О. Г., Кучеренко С. Н., Камнева Л. Э. и др., СПб.: Астерион, 2026.
Настоящее учебное пособие представляет собой учебно-методический комплекс по ан-глийскому языку для специальных целей (ESP) в сфере экономики материальных и нема-териальных активов. При формировании пособия применены (i) современные методы кор-пусной лингвистики, включая частотный анализ и выявление ключевых слов на основе анализа аутентичных текстов, отражающих актуальные тенденции профессионального дискурса, а также (ii) технологии искусственного интеллекта для автоматизированной ...
Добавлено: 16 мая 2026 г.
Natural hazard database from Internet publications: text mining with a large language model
Деркачева А. А., Сакиркина М. А., Краев Г. Н. и др., /. 2026.
Добавлено: 28 апреля 2026 г.
Школьный литературный канон эмиграции 1918–1939 гг.
Стрижкова Д. А., / Институт русской литературы (Пушкинский Дом) РАН. Серия B001 "Репозиторий открытых данных по русской литературе и фольклору". 2026.
В базе данных представлена роспись русскоязычных литературных произведений и отрывков, напечатанных в учебниках по словесности, хрестоматиях, книгах для чтения, сборниках стихотворений и рассказов, выходивших во Франции, Германии, Латвии, Эстонии, Болгарии, Сербии в период первой волны русской эмиграции с 1918 по 1939 гг. Датасет представляет интерес для исследователей школьного литературного канона, эмиграции и детского чтения ...
Добавлено: 22 апреля 2026 г.
Algorithmic overlaps as thermodynamic variables: from local to cluster Monte Carlo dynamics in critical phenomena
Пиле Я. Э., Deng Y., Щур Л. Н., / Series arXiv "math". 2026. No. 2604.10254.
Добавлено: 20 апреля 2026 г.
Современная российская мультипликация как инструмент воспитания традиционных духовно-нравственных ценностей
Жигунов А. Ю., / Basic Research Programme. Серия HUM "Humanities". 2026. № 1.
В статье предпринимается попытка описания образовательного и воспитательного потенциала современной российской анимации в аспекте формирования представлений молодого поколения о традиционных российских ценностях. С опорой на медиа- и семиотический анализ, метод культурно-исторической интерпретации рассмотрены анимационные российские проекты, созданные с 2000 года по 2025 гг., находившиеся в прокате в эфире телевизионных каналов либо стриминговых сервисов с большой ...
Добавлено: 19 апреля 2026 г.
Using predefined vector systems to speed up neural network multimillion class classification
Gabdullin N., Андросов И. А., / Series Computer Science "arxiv.org". 2026.
Добавлено: 2 апреля 2026 г.
Российская социология в условиях цифровизации общества: результаты анализа корпуса научных текстов
Смирнов А. В., Социологические исследования 2023 № 4 С. 39–50
На массиве публикаций из восьми ведущих социологических журналов за период с 2000 по 2021 г. методами анализа текстов изучаются особенности влияния цифровизации общества на социологию. Частотный анализ 13,8 тыс. научных текстов позволил отследить введение в научный оборот концептов, связанных с цифровизацией. Выявлялись различия между журналами. Изучался опыт использования цифровых социальных платформ в качестве источника данных и ...
Добавлено: 18 марта 2026 г.
  • О ВЫШКЕ
  • Цифры и факты
  • Руководство и структура
  • Устойчивое развитие в НИУ ВШЭ
  • Преподаватели и сотрудники
  • Корпуса и общежития
  • Закупки
  • Обращения граждан в НИУ ВШЭ
  • Фонд целевого капитала
  • Противодействие коррупции
  • Сведения о доходах, расходах, об имуществе и обязательствах имущественного характера
  • Сведения об образовательной организации
  • Людям с ограниченными возможностями здоровья
  • Единая платежная страница
  • Работа в Вышке
  • ОБРАЗОВАНИЕ
  • Лицей
  • Довузовская подготовка
  • Олимпиады
  • Прием в бакалавриат
  • Вышка+
  • Прием в магистратуру
  • Аспирантура
  • Дополнительное образование
  • Центр развития карьеры
  • Бизнес-инкубатор ВШЭ
  • Образовательные партнерства
  • Обратная связь и взаимодействие с получателями услуг
  • НАУКА
  • Научные подразделения
  • Исследовательские проекты
  • Мониторинги
  • Диссертационные советы
  • Защиты диссертаций
  • Академическое развитие
  • Конкурсы и гранты
  • Внешние научно-информационные ресурсы
  • РЕСУРСЫ
  • Библиотека
  • Издательский дом ВШЭ
  • Книжный магазин «БукВышка»
  • Типография
  • Медиацентр
  • Журналы ВШЭ
  • Публикации
  • http://www.minobrnauki.gov.ru/
    Министерство науки и высшего образования РФ
  • https://edu.gov.ru/
    Министерство просвещения РФ
  • http://www.edu.ru
    Федеральный портал «Российское образование»
  • https://elearning.hse.ru/mooc
    Массовые открытые онлайн-курсы
  • НИУ ВШЭ1993–2026
  • Адреса и контакты
  • Условия использования материалов
  • Политика конфиденциальности
  • Правила применения рекомендательных технологий в НИУ ВШЭ
  • Карта сайта
Редактору