Russian challenges for quantitative research

Kopotev M.; O. Lyashevskaya; Mustajoki A.

Публикации

?

Russian challenges for quantitative research

P. 3–29.

Kopotev M., Ляшевская О. Н., Mustajoki A.

Язык: английский

Полный текст

Текст на другом сайте

Ключевые слова: русский язык анализ данных корпусная лингвистика Russian language corpus linguistics русистика экспериментальная лингвистика data analysis Experimental Linguistics квантитативная лингвистика quantitative methods in linguistics Russian linguistics quantitative linguistics квантитативные методы в лингвистике

В книге

Quantitative approaches to the Russian language

Abingdon: Routledge, 2018.

Систематизация равноправных произносительных вариантов в современном русском языке (на материале орфоэпических словарей)

Зубов В. И., Вопросы лексикографии 2026 № 40 С. 64–86

В статье представлена база данных равноправных произносительных вариантов современного русского языка, разработанная на материале трёх нормативных орфоэпических словарей: https://varuspeech.ru/. Описываются принципы отбора и систематизации вариантов, а также методика их разметки по типам и областям вариативности. Показаны расхождения между источниками и общие тенденции равноправной вариативности для отдельных форм и для лексем, а также роль частотности лексем ...

Добавлено: 23 июля 2026 г.

Russian Pronouns with Focus Antecedents: Coreference and Binding in Corpora

Тискин Д. Б., Компьютерная лингвистика и интеллектуальные технологии 2026 No. 24 P. 656–665

D:/Output/2025/Dialogue_after_review.pdfНесмотря на значительный интерес к факторам, определяющим выбор между личными и возвратными местоимениями с антецедентом в русском языке, роль отношения к антецеденту (кореферентность или связывание) остаётся слабо изученной, а приемлемость отдельных примеров вызывает споры. В настоящей работе на материале веб-корпусов (Araneum и ГИКРЯ) исследуется влияние, оказываемое на интерпретацию местоимения как кореферентного фокусному антецеденту или связанного ...

Добавлено: 19 июля 2026 г.

Тезисы докладов Пятнадцатых Шмелёвских чтений: (К 100-летию со дня рождения академика Дмитрия Николаевича Шмелева):Жизнь слова: Научное наследие академика Д. Н. Шмелева в контексте современности

М.: Институт русского языка им. В.В. Виноградова РАН, 2026.

Сборник тезисов Пятнадцатых Шмелёвских чтений (К 100-летию со дня рождения академика Дмитрия Николаевича Шмелева) Жизнь слова: Научное наследие академика Д. Н. Шмелева в контексте современности. Охватывает разные аспекты современной русистики: от исторической лексикологии до современных трансформаций прагматики и семантики слов. ...

Добавлено: 23 июня 2026 г.

Зачем нужен поэтический корпус и как его использовать

Корчагин К. М., Русская речь 2019 Т. 6 С. 113–127

Поэтический корпус в составе Национального корпуса русского языка — инструмент для исследователей русской поэзии и поэтическо го языка. Корпус содержит обширную коллекцию русской поэзии XVIII ХХ веков, отражает все заметные поэтические направления и продол жает пополняться. В нем присутствуют два типа разметки — граммати ческая и стиховедческая. Если первая совпадает с разметкой в основ ном ...

Добавлено: 19 июня 2026 г.

Syntactic functions of non-manuals in Russian Sign Language

Burkova S., Khristoforova E., Kimmelman V., , in: Advances in Sign Language Corpus Linguistics.: John Benjamins Publishing Company, 2023. P. 90–129.

Добавлено: 3 июня 2026 г.

Juxtapositional vs. possessive-like encoding in Russian specificational constructions

Логвинова Н. Н., Russian linguistics 2026 Vol. 50 Article 11

Добавлено: 18 мая 2026 г.

Focus on vocabulary. Экономика материальных и нематериальных активов: корпусный словарь и ИИ-упражнения по английскому языку

Горина О. Г., Кучеренко С. Н., Камнева Л. Э. и др., СПб.: Астерион, 2026.

Настоящее учебное пособие представляет собой учебно-методический комплекс по ан-глийскому языку для специальных целей (ESP) в сфере экономики материальных и нема-териальных активов. При формировании пособия применены (i) современные методы кор-пусной лингвистики, включая частотный анализ и выявление ключевых слов на основе анализа аутентичных текстов, отражающих актуальные тенденции профессионального дискурса, а также (ii) технологии искусственного интеллекта для автоматизированной ...

Добавлено: 16 мая 2026 г.

Современные методы анализа временных рядов в мониторинге и прогнозировании состояния оборудования для механизированной добычи

Незнанов А. А., Глушко А. А., Овчинников С. и др., В кн.: Интеллектуальный анализ данных в нефтегазовой отрасли.: М.: ООО «Геомодель Развитие», 2024. С. 140–143.

С развитием систем мониторинга мы получили возможность собирать ключевые показатели работы устройств в процессе механизированной добычи. Каждый день генерируется огромное количество телеметрии, которая пройдя процесс гармонизации и трансформации может быть использована для прогнозирования состояния оборудования. В докладе представлен обзор и произведён отбор современных математических методов и программных реализации инструментов анализа многомерных нерегулярных временных рядов для ...

Добавлено: 29 апреля 2026 г.

Интеллектуальная гармонизация и трансформация данных механизированной добычи на основе открытых решений

Незнанов А. А., Емельянов В., Глушко А. А. и др., В кн.: Интеллектуальный анализ данных в нефтегазовой отрасли.: М.: ООО «Геомодель Развитие», 2024. С. 42–45.

Сложность задач обработки данных в корпоративных информационных системах нефтегазовой отрасли постоянно растёт в том числе в связи с постоянным ростом количества и разнообразия данных, что требует внедрения современных методологий и инструментов управления данными и знаниями. Многие архитектурные решения уже апробированы консорциумом OSDU, но в условиях локализации и быстро изменяющегося IT-ландшафта необходима не просто попытка повторить ...

Добавлено: 29 апреля 2026 г.

Российская социология в условиях цифровизации общества: результаты анализа корпуса научных текстов

Смирнов А. В., Социологические исследования 2023 № 4 С. 39–50

На массиве публикаций из восьми ведущих социологических журналов за период с 2000 по 2021 г. методами анализа текстов изучаются особенности влияния цифровизации общества на социологию. Частотный анализ 13,8 тыс. научных текстов позволил отследить введение в научный оборот концептов, связанных с цифровизацией. Выявлялись различия между журналами. Изучался опыт использования цифровых социальных платформ в качестве источника данных и ...

Добавлено: 18 марта 2026 г.

Дискриминативная лемматизация сокращений в эпоху LLM

Глазкова А. В., Смаль И. В., Ляшевская О. Н. и др., Доклады Российской академии наук. Математика, информатика, процессы управления (ранее - Доклады Академии Наук. Математика) 2025 Т. 527 С. 146–155

В работе представлено исследование эффективности дискриминативных методов лемматизации сокращений в русскоязычных текстах. В отличие от генеративных подходов, дискриминативные модели осуществляют выбор оптимальной леммы из фиксированного набора вариантов, что исключает риск генерации грамматически некорректных словоформ. Впервые для русского языка проводится комплексный анализ четырех контекстно-ориентированных подходов: (1) ранжирования на основе маскированного языкового моделирования, (2) бинарной классификации, (3) ...

Добавлено: 10 марта 2026 г.

Rubic2: Ensemble Model for Russian Lemmatization

Афанасьев И. А., Glazkova A., Ляшевская О. Н. и др., , in: Proceedings of the 10th Workshop on Slavic Natural Language Processing (Slavic NLP 2025).: Association for Computational Linguistics, 2025. P. 157–170.

Добавлено: 10 марта 2026 г.