Синтаксис повседневной русской речи сквозь призму N-грамм анализа

Т. Ю. Шерстинова

?

Синтаксис повседневной русской речи сквозь призму N-грамм анализа

С. 454–466.

В предлагаемом исследовании для выявления типовых синтаксических конструкций повседневной устной речи используется метод N-грамм анализа, применяемый в компьютерной лингвистике для построения вероятностных моделей языка. Материалом для исследования стал морфологически аннотированный подкорпус звукового корпуса «Один речевой день» в объеме 149 737 токенов, содержащий фрагменты повседневной речи 213 человек. Получена информация о распределении частей речи и нелексических токенов, входящих во фразовую разметку расшифровок устной речи, определены наиболее типичные части речи, характерные для начальной позиции фраз и синтагм, а также для финальной позиции фраз в зависимости от их типа, приведены списки наиболее частотных биграмм и триграмм с указанием их вероятности.

Язык: русский

Полный текст

Ключевые слова: русский язык вероятность синтаксис корпусная лингвистика части речи повседневная речь

В книге

Русская грамматика: Структурная организация языка и процессы языкового функционирования

М.: ЛЕНАНД, 2019.

К синтаксису клауз с аспектуальными глаголами в якутском языке

Баркова Л. А., Родной язык: лингвистический журнал 2026 № 1 С. 9–58

В статье исследуется синтаксис конструкций с аспектуальными глаголами в якутском языке. В таких конструкциях есть два предиката: лексический глагол, который стоит в форме конверба, и аспектуальный глагол, который передает какое-либо грамматическое значение и является финитным. Синтаксис таких конструкций уже был исследован для некоторых других тюркских языков. В этой работе рассматривались особенности положения аффиксов пассива, каузатива ...

Добавлено: 23 июля 2026 г.

Систематизация равноправных произносительных вариантов в современном русском языке (на материале орфоэпических словарей)

Зубов В. И., Вопросы лексикографии 2026 № 40 С. 64–86

В статье представлена база данных равноправных произносительных вариантов современного русского языка, разработанная на материале трёх нормативных орфоэпических словарей: https://varuspeech.ru/. Описываются принципы отбора и систематизации вариантов, а также методика их разметки по типам и областям вариативности. Показаны расхождения между источниками и общие тенденции равноправной вариативности для отдельных форм и для лексем, а также роль частотности лексем ...

Добавлено: 23 июля 2026 г.

Тезисы докладов Пятнадцатых Шмелёвских чтений: (К 100-летию со дня рождения академика Дмитрия Николаевича Шмелева):Жизнь слова: Научное наследие академика Д. Н. Шмелева в контексте современности

М.: Институт русского языка им. В.В. Виноградова РАН, 2026.

Сборник тезисов Пятнадцатых Шмелёвских чтений (К 100-летию со дня рождения академика Дмитрия Николаевича Шмелева) Жизнь слова: Научное наследие академика Д. Н. Шмелева в контексте современности. Охватывает разные аспекты современной русистики: от исторической лексикологии до современных трансформаций прагматики и семантики слов. ...

Добавлено: 23 июня 2026 г.

Зачем нужен поэтический корпус и как его использовать

Корчагин К. М., Русская речь 2019 Т. 6 С. 113–127

Поэтический корпус в составе Национального корпуса русского языка — инструмент для исследователей русской поэзии и поэтическо го языка. Корпус содержит обширную коллекцию русской поэзии XVIII ХХ веков, отражает все заметные поэтические направления и продол жает пополняться. В нем присутствуют два типа разметки — граммати ческая и стиховедческая. Если первая совпадает с разметкой в основ ном ...

Добавлено: 19 июня 2026 г.

Juxtapositional vs. possessive-like encoding in Russian specificational constructions

Логвинова Н. Н., Russian linguistics 2026 Vol. 50 Article 11

Добавлено: 18 мая 2026 г.

Focus on vocabulary. Экономика материальных и нематериальных активов: корпусный словарь и ИИ-упражнения по английскому языку

Горина О. Г., Кучеренко С. Н., Камнева Л. Э. и др., СПб.: Астерион, 2026.

Настоящее учебное пособие представляет собой учебно-методический комплекс по ан-глийскому языку для специальных целей (ESP) в сфере экономики материальных и нема-териальных активов. При формировании пособия применены (i) современные методы кор-пусной лингвистики, включая частотный анализ и выявление ключевых слов на основе анализа аутентичных текстов, отражающих актуальные тенденции профессионального дискурса, а также (ii) технологии искусственного интеллекта для автоматизированной ...

Добавлено: 16 мая 2026 г.

Российская социология в условиях цифровизации общества: результаты анализа корпуса научных текстов

Смирнов А. В., Социологические исследования 2023 № 4 С. 39–50

На массиве публикаций из восьми ведущих социологических журналов за период с 2000 по 2021 г. методами анализа текстов изучаются особенности влияния цифровизации общества на социологию. Частотный анализ 13,8 тыс. научных текстов позволил отследить введение в научный оборот концептов, связанных с цифровизацией. Выявлялись различия между журналами. Изучался опыт использования цифровых социальных платформ в качестве источника данных и ...

Добавлено: 18 марта 2026 г.

ВЕРОЯТНОСТЬ НЕЗАВИСИМОСТИ (сюжет для исследовательских проектов школьников)

Семенов П. В., Математика в школе 2024 № 4 С. 34–40

Приведены простые примеры, показывающие, что независимость двух случайных событий – весьма редкое обстоятельство. Показано, как можно оценивать его частоту. Поставлены открытые вопросы ...

Добавлено: 14 марта 2026 г.

Дискриминативная лемматизация сокращений в эпоху LLM

Глазкова А. В., Смаль И. В., Ляшевская О. Н. и др., Доклады Российской академии наук. Математика, информатика, процессы управления (ранее - Доклады Академии Наук. Математика) 2025 Т. 527 С. 146–155

В работе представлено исследование эффективности дискриминативных методов лемматизации сокращений в русскоязычных текстах. В отличие от генеративных подходов, дискриминативные модели осуществляют выбор оптимальной леммы из фиксированного набора вариантов, что исключает риск генерации грамматически некорректных словоформ. Впервые для русского языка проводится комплексный анализ четырех контекстно-ориентированных подходов: (1) ранжирования на основе маскированного языкового моделирования, (2) бинарной классификации, (3) ...

Добавлено: 10 марта 2026 г.

Rubic2: Ensemble Model for Russian Lemmatization

Афанасьев И. А., Glazkova A., Ляшевская О. Н. и др., , in: Proceedings of the 10th Workshop on Slavic Natural Language Processing (Slavic NLP 2025).: Association for Computational Linguistics, 2025. P. 157–170.

Добавлено: 10 марта 2026 г.

Transformer-based approaches for lemmatizing abbreviations in Russian texts

Glazkova A., Ляшевская О. Н., Morozov D. и др., Journal of Mathematical Sciences 2025 Vol. 546 P. 32–47

Добавлено: 10 марта 2026 г.

Говорящий и пишущий: К 100-летию со дня рождения Татьяны Григорьевны Винокур

М.: Институт русского языка им. В.В. Виноградова РАН, 2024.

Книга посвящена памяти замечательного ученого-русиста — Татьяны Григорьевны Винокур (1924–1992). Проблематика собранных в книге научных статей отражает широту исследовательских интересов Татьяны Григорьевны: история языка, поэтика, язык художественной литературы, стилистика, культура речи, проблемы изучения коммуникации и многие другие темы. Впервые публикуется текст беседы Т. Г.Винокур из цикла «Бесед о русском языке» на всероссийском радио — цикла, ...

Добавлено: 8 марта 2026 г.

Promotional adjectives in grant proposal abstracts: a corpus study

Dmitriy S. Tulyakov, Tatiana M. Permyakova, Ekaterina A. Balezina, Вестник Волгоградского государственного университета. Серия 2: Языкознание 2025 Vol. 24 No. 6 P. 58–67

Эффективно интегрируя дискурс продвижения в аннотации заявок на гранты, исследователи могут более убедительно представить свои идеи и повысить шансы на получение финансирования. Частотность использования прилагательных продвижения при написании заявок на гранты может отличаться в разных областях исследований. В данной статье рассматривается употребление прилагательных продвижения в аннотациях заявок на гранты в шести научных сферах. Основная гипотеза ...

Добавлено: 2 марта 2026 г.

Кирина М. А., Лукьянчикова А. С., В кн.: Язык в эпоху цифровых трансформаций и развития искусственного интеллекта : Сборник научных статей по итогам II Международной научной конференции Минск, 23–24 октября 2025 г.: Мн.: БГУИЯ, 2025. С. 74–85.

В статье рассматриваются характерные особенности гороскопических текстов как части астрологического дискурса. Материалом исследования выступает представительная выборка ежедневных предсказаний на русском языке, опубликованных в открытых группах социальной сети «ВКонтакте», суммарным объемом 1185425 словоупотреблений. С использованием методов корпусной и компьютерной лингвистики анализируются содержательные лексические единицы – как общие, так и отличительные для каждого знака зодиака (в сопоставлении ...

Добавлено: 28 февраля 2026 г.

Грамматический ландшафт художественной прозы: динамика частеречных распределений в русском рассказе XX века

Кирина М. А., В кн.: Русская грамматика: полипарадигмальность как методологический принцип современных научных исследований : материалы IX Международного научного симпозиума.: Издательство ИГУ, 2025. С. 270–275.

В статье представлены результаты пилотного исследования, направленного на описание дистрибуции частей речи в синхронии и диахронии на материале русской прозы малой формы. Рассматриваются изменения морфологического состава художественных текстов (на уровне грамматических классов) на протяжении XX века в соответствии с 9 историко-культурными периодами. Материалом исследования выступает выборка из 943 рассказов суммарным объемом более 3 млн. словоупотреблений. ...

Добавлено: 28 февраля 2026 г.

Об одной задаче, связанной с моментом первого достижения заданного уровня случайным процессом

Семаков С. Л., Автоматика и телемеханика 2025 № 12 С. 104–118

Рассматривается задача оценки вероятности события, состоящего в том, что первое достижение заданного уровня непрерывным случайным процессом произойдет в какой-либо момент из заданного промежутка изменения независимой переменной. Ранее полученные результаты общего характера конкретизируются для гауссовского гладкого процесса. Приводятся результаты численных расчетов оценок при различных параметрах процесса. ...

Добавлено: 23 февраля 2026 г.