?
Интерпретация семантических связей в текстах русскоязычного сегмента Живого Журнала на основе тематической модели LDA
С. 135–142.
Данная статья отражает результаты экспериментов по моделированию тематики корпуса текстов Живого Журнала (ЖЖ)
Livejournal.ru с помощью программного комплекса TopicMiner, основанного на алгоритме LDA (Latent Dirichlet Allocation).
Экспериментальные данные позволяют определить содержательное наполнение тем, отраженных в записях пользователей ЖЖ, и описать основные типы семантических связей слов внутри тем. Исследовательский
материал допускает интерпретацию с позиций теории лексических функций, фреймовой семантики и грамматики конструкций.
Полученные результаты позволяют судить о динамике языкового сознания русскоязычных пользователей социальных сетей.
Язык:
русский
Ключевые слова: компьютерная лингвистикаграмматическая семантикаЖивой Журналвероятностное тематическое моделирование
ПУБЛИКАЦИЯ ПОДГОТОВЛЕНА ПО РЕЗУЛЬТАТАМ ПРОЕКТА:
П.Е. Белова, А.К. Сафарян, В кн.: Научно-практическая конференция с международным участием "Национальные и международные тенденции и перспективы развития судебной экспертизы". Сборник докладов.: Н. Новгород: Изд-во ННГУ им. Н.И. Лобачевского, 2024.
В данной статье представлено описание системы автоматического поиска и извлечения побуждений из текстов на русском языке FindImper, основанной на поиске глагольных форм и синтаксических связей. Алгоритм реализован на языке программирования Python с использованием библиотек для морфологического и синтаксического анализа и набора правил. Данный инструмент направлен на оптимизацию работы эксперта-лингвиста и доступен к использованию через веб-сайт ...
Добавлено: 30 января 2026 г.
Мыльникова А. В., Гасимов А. Р., Научно-техническая информация. Серия 2: Информационные процессы и системы 2025 № 9 С. 33–38
На основе изучения функционирования больших языковых моделей (LLMs) и специфических характеристик машинной обработки дискурса показано применение экспериментального метода компьютерного и лингвистического анализа для статистического исследования и интерпретации лингвистических характеристик текстов. В качестве материалов исследования использован лингвистический корпус текстов Brown, а также корпуса искусственно сгенерированных текстов с применением Claude Sonnet 3.7 и Grok-3. В механизмах обработки ...
Добавлено: 19 ноября 2025 г.
Хоменко А. Ю., Kasimova L., Sychugov E. и др., Psychiatria Danubina 2025 Vol. 37 No. Suppl. 1 P. 213–223
Раннее распознавание аутоагрессивных тенденций у молодых людей имеет важное значение для диагностического скрининга и снижения рисков суицидального поведения. Этого можно достичь с помощью психолингвистических подходов, таких как анализ корпусов текстов и айтрекинг-исследования. Корпусные исследования помогают выявить обобщенные речевые паттерны лиц из группы риска суицида, в то время как окулографические методы изучают перцептивные маркеры, связанные с ...
Добавлено: 19 октября 2025 г.
[б.и.], 2025.
Сборник включает 39 докладов международной конференции по компьютерной лингвистике и интеллектуальным технологиям «Диалог 2025», представляющих широкий спектр теоретических и прикладных исследований в области описания естественного языка, моделирования языковых процессов, создания практически применимых компьютерных лингвистических технологий. Для специалистов в области теоретической и прикладной лингвистики и интеллектуальных технологий. ...
Добавлено: 19 октября 2025 г.
Волков О. С., Известия РАН. Серия литературы и языка 2023 Т. 82 № 4 С. 82–90
В статье делаются некоторые наблюдения о семантике частиц типа русского уже. Мы предполагаем, что определяющую роль в семантике таких частиц играет контрастивность – и она же является ключом к тому, что в некоторых языках подобные показатели начинают функционировать как перфектные. Статья состоит из двух частей. Первая часть посвящена семантике русской частицы уже; во второй части ...
Добавлено: 13 февраля 2025 г.
Волков О. С., Русская речь 2023 № 4 С. 25–39
Русские глагольные циркумфиксы неоднократно привлекали внимание исследователей. В литературе есть два господствующих направления: ряд авторов рассматривает семантику циркумфиксов в контексте показателей «способов действия», при этом не отделяя их от префиксов. Другие авторы заостряют внимание на том, существуют ли циркумфиксы вообще как единая деривация, или же они являются по сути двумя ступенями словообразования — комбинацией префикса ...
Добавлено: 13 февраля 2025 г.
Мазитова Л. Л., Пантелеева Л. М., Вестник Самарского университета. История, педагогика, филология 2024 Т. 30 № 4 С. 156–164
В статье излагается методика создания антропологического корпуса текстов, объединенных
принадлежностью к шахтерской профессии. Содержание работы коррелирует с тремя исследовательскими
задачами: разработкой тематической классификации, введением условных обозначений для выделения нарратива в тексте, определением принципов организации корпуса по тематике нарративов. Тематическая классификация нарративов стала результатом анализа нескольких «контрольных» текстов. Она представляет собой ступенчатую систематизацию культурно-профессиональной тематики, поскольку, помимо основных (базовых) тем, может ...
Добавлено: 18 января 2025 г.
Статья посвящена анализу метрик лингвистической сложности текстов Виртуального визита по Главному музейному комплексу Государственного Эрмитажа, размещенного на сайте музея. Цель исследования – определить, в какой мере лингвистические характеристики данных текстов коррелируют с признаками виртуальной экскурсии по музею как речевого жанра. Значения метрик текстов виртуального визита анализируются на фоне значений аналогичных метрик научных искусствоведческих текстов и ...
Добавлено: 8 ноября 2024 г.
Иордани Н. П., Филология и культура 2023 № 1 С. 14–19
В статье рассматриваются особенности заполнения субъектной валентности при инфинитиве с частицей бы в старорусском и современном русском языках. В качестве материала для исследования были использованы данные Национального корпуса русского языка и рукописные сборники заговоров XVII–XVIII вв. Как в современном русском языке, так и в старорусский период инфинитив с частицей бы сочетается только с агентивными субъектами ...
Добавлено: 5 ноября 2024 г.
РГГУ, 2022.
Сборник включает 17 докладов международной конференции по компьютерной лингвистике и интеллектуальным технологиям «Диалог 2022», представляющих широкий спектр теоретических и прикладных исследований в области компьютерного моделирования естественного языка и создания новых лингвистических технологий. Для специалистов в области теоретической и прикладной лингвистики и интеллектуальных технологий. ...
Добавлено: 24 мая 2024 г.
Каз.: Издательство Академии наук Республики Татарстан, 2023.
В этом году на базе Бухарского государственного университета прошла уже одиннадцатая международная конференция по компьютерной обработке тюркских языков TurkLang-2023. Предыдущие 10 конференций прошли в Астане (2013, 2022), Стамбуле (2014), Казани (2015, 2017), Бишкеке (2016), Ташкенте (2018), Симферополе (2019), Уфе (2020), Кызыле (2021). География проведения, количество представленных трудов и состав участников конференции подтверждают, что в настоящее ...
Добавлено: 6 марта 2024 г.
Bochkarev V. V., Shevlyakova A., Solovyev V. и др., Diachronica 2023 Vol. 40 No. 4 P. 492–531
Добавлено: 19 февраля 2024 г.
Кругликова В. Г., В кн.: Анализ речи: теоретические и прикладные аспекты: сборник научных статей.: [б.и.], 2023.
В статье представлен сравнительный анализ различных языковых моделей, используемых для генерации текстов, и произведена оценка их эффективности для задачи генерации диалоговой речи. В сравнительном анализе участвуют модели GPT-3, BERT, LSTM. Данное исследование является частью проекта по разработке системы генерации диалогов на русском языке. В работе также описана архитектура разрабатываемой системы и предложены примеры её использования. ...
Добавлено: 10 декабря 2023 г.
Кирина М. А., Человек: образ и сущность. Гуманитарные аспекты 2024 № 2(58) С. 176–204
В статье рассматриваются способы автоматического анализа мнений для оценки пользовательского опыта применительно к отзывам на проекты в рамках онлайн-курсов по программированию на Python, Java и Kotlin, представленных на англоязычной образовательной платформе Hyperskill. В исследовании описывается подход с опорой на методы анализа тональности и извлечения ключевых слов для характеристики отношения пользователей к изучаемым темам, образовательному процессу ...
Добавлено: 9 декабря 2023 г.
Колмогорова А. В., Виртуальная коммуникация и социальные сети 2023 Т. 2023 № 3(7) С. 124–130
Статья посвящена анализу семантических изданий - нового цифрового формата представления текстов и персоналий «большой литературы» в веб-пространстве. На материале проектов The World of Dante, Mapping the Republic of Letters, Chekhov Digital, Tolstoy Digital (с веб-приложением 91-й том), Pushkin Digital, посвященных текстам Д. Алигьери, А. С. Пушкина, Л. Н. Толстого и А. П. Чехова, раскрываются техника ...
Добавлено: 31 октября 2023 г.
Колмогорова А. В., Terra Linguistica 2023 Т. 14 № 1 С. 7–10
Публикация посвящена анализу современного состояния инженерной лингвистики, ее основных направлений и исследовательских вызовов. Формулируется определение языковых технологий и их типология по критерию решаемых с их помощью задач. Отмечается, что отечественной школе инженерной лингвистики удается сохранить баланс между технологичностью и лингвистичностью изысканий. ...
Добавлено: 31 октября 2023 г.