?
Texterra: инфраструктура для анализа текстов.
Труды Института системного программирования РАН. 2014. Т. 26. № 1. С. 421–438.
Денис Турдаков, Недумов Я., Астраханцев Н., Сысоев А., Андрианов И., Майоров В., Федоренко Д., Коршунов А., Кузнецов С.
В статье описан проект Texterra, в рамках которого была создана инфраструктура для анализа текстов. Texterra предоставляет масштабируемое решение для быстрой обработки текстовых документов, основанное на использовании знаний, извлекаемых из Веб-ресурсов и текстовых документов. В данной статье раскрываются детали реализации проекта, варианты использования и результаты экспериментальных исследований разработанных инструментов.
Добавлено: 19 мая 2026 г.
Добавлено: 28 апреля 2026 г.
Абрегова З. Х., Двойникова А. А., В кн.: Альманах научных работ молодых ученых Университета ИТМО.: Университет ИТМО, 2025. С. 487–493.
В статье рассматриваются различные методы аспектного анализа тональности текстовых данных, включая как традиционные методы, основанные на правилах, так и современные алгоритмы машинного и глубокого обучения. В работе представлен сравнительный анализ корпусов данных и методов аспектного анализа тональности текстов, который является важной задачей в области обработки естественного языка и анализа данных. ...
Добавлено: 25 апреля 2026 г.
Анкудинов И. А., Социология: методология, методы, математическое моделирование 2025 № 61 С. 165–203
Изменчивые политические настроения россиян — постоянный предмет интереса социологических фондов. С развитием интернета привычные анкетные исследования стали дополняться онлайн-опросами и, несмотря на некоторый скепсис, «майнингом» социальных сетей. В настоящей статье предпринимается попытка скорректировать стихийную интернет-выборку так, чтобы приблизить ее оценки к репрезентативным омнибусам. Мы используем показатели доверия Президенту РФ в сети и в опросах с ...
Добавлено: 22 апреля 2026 г.
Добавлено: 20 апреля 2026 г.
Федоров А. О., Вакку Г. В., Лебедева С. Э., Галактика медиа: журнал медиа исследований 2026 Т. 8 № 2 С. 163–182
С увеличением объемов данных преподаватель вуза может потратить годы на обработку и систематизацию информации. Персонализированная помощь, рекомендации по контенту, сбор данных для обзоров литературы и оформление библиографических ссылок укрепляют роль искусственного интеллекта как эффективного нейросетевого инструмента научной коммуникации. В данной статье рассматриваются практические примеры использования таких инструментов, как Elicit, SciSpace, Consensus, Undermind и Paperfinder, для упрощения ...
Добавлено: 7 апреля 2026 г.
Gabdullin N., Андросов И. А., / Series Computer Science "arxiv.org". 2026.
Добавлено: 2 апреля 2026 г.
П.Е. Белова, А.К. Сафарян, В кн.: Научно-практическая конференция с международным участием "Национальные и международные тенденции и перспективы развития судебной экспертизы". Сборник докладов.: Н. Новгород: Изд-во ННГУ им. Н.И. Лобачевского, 2024.
В данной статье представлено описание системы автоматического поиска и извлечения побуждений из текстов на русском языке FindImper, основанной на поиске глагольных форм и синтаксических связей. Алгоритм реализован на языке программирования Python с использованием библиотек для морфологического и синтаксического анализа и набора правил. Данный инструмент направлен на оптимизацию работы эксперта-лингвиста и доступен к использованию через веб-сайт ...
Добавлено: 30 января 2026 г.
Сорокин К. С., Бекетов М. Е., Онучин А. и др., / arxiv.org. Серия cs.SI "Social and Information Networks ". 2025.
Обнаружение сообществ в сложных сетях — фундаментальная проблема, открытая для новых подходов в различных научных областях. Мы представляем новый метод обнаружения сообществ, основанный на потоке Риччи на графах. Наша техника итеративно обновляет веса ребер (их метрические длины) в соответствии с их (комбинаторной) версией кривизны Риччи Фостера, вычисленной на основе эффективного расстояния сопротивления между узлами. Известно, ...
Добавлено: 15 января 2026 г.
Петрованов И. С., Сергеев А. В., / Series Computer Science "arxiv.org". 2025. No. 2512.18332.
Добавлено: 24 декабря 2025 г.
Hessian-based lightweight neural network for brain vessel segmentation on a minimal training dataset
Меньшиков И. А., Бернадотт А. К., Елфимов Н. С., / Series arXie "Statistical mechanics". 2025.
Добавлено: 1 декабря 2025 г.
Добавлено: 21 ноября 2025 г.
Мыльникова А. В., Гасимов А. Р., Научно-техническая информация. Серия 2: Информационные процессы и системы 2025 № 9 С. 33–38
На основе изучения функционирования больших языковых моделей (LLMs) и специфических характеристик машинной обработки дискурса показано применение экспериментального метода компьютерного и лингвистического анализа для статистического исследования и интерпретации лингвистических характеристик текстов. В качестве материалов исследования использован лингвистический корпус текстов Brown, а также корпуса искусственно сгенерированных текстов с применением Claude Sonnet 3.7 и Grok-3. В механизмах обработки ...
Добавлено: 19 ноября 2025 г.
Рубчинский А. А., Чубарова Д. А., / Series WP7 "Математические методы анализа решений в экономике, бизнесе и политике". 2025. No. WP7/2025/01.
Добавлено: 9 ноября 2025 г.
Психолингвистический анализ непрофессионального дискурса о коррупции в социальной сети в «ВКонтакте»
Кузнецова Ю. М., Максименко А. А., Станкевич М. А. и др., Мониторинг общественного мнения: Экономические и социальные перемены 2026 № 1 С. 231–250
Статья посвящена анализу непрофессионального онлайн-дискурса о коррупции, представленного в социальной сети «ВКонтакте». В отличие от институционального или экспертного подхода, фокус на обыденной, пользовательской рефлексии позволяет уловить глубинные ценностные установки, формы выражения и языковые паттерны повседневной морали, что особенно актуально в условиях роста значимости социальных сетей как источника информации и формирования общественных настроений. Целью исследования являлось ...
Добавлено: 6 ноября 2025 г.
Хоменко А. Ю., Kasimova L., Sychugov E. и др., Psychiatria Danubina 2025 Vol. 37 No. Suppl. 1 P. 213–223
Раннее распознавание аутоагрессивных тенденций у молодых людей имеет важное значение для диагностического скрининга и снижения рисков суицидального поведения. Этого можно достичь с помощью психолингвистических подходов, таких как анализ корпусов текстов и айтрекинг-исследования. Корпусные исследования помогают выявить обобщенные речевые паттерны лиц из группы риска суицида, в то время как окулографические методы изучают перцептивные маркеры, связанные с ...
Добавлено: 19 октября 2025 г.
[б.и.], 2025.
Сборник включает 39 докладов международной конференции по компьютерной лингвистике и интеллектуальным технологиям «Диалог 2025», представляющих широкий спектр теоретических и прикладных исследований в области описания естественного языка, моделирования языковых процессов, создания практически применимых компьютерных лингвистических технологий. Для специалистов в области теоретической и прикладной лингвистики и интеллектуальных технологий. ...
Добавлено: 19 октября 2025 г.
Мазитова Л. Л., Пантелеева Л. М., Вестник Самарского университета. История, педагогика, филология 2024 Т. 30 № 4 С. 156–164
В статье излагается методика создания антропологического корпуса текстов, объединенных
принадлежностью к шахтерской профессии. Содержание работы коррелирует с тремя исследовательскими
задачами: разработкой тематической классификации, введением условных обозначений для выделения нарратива в тексте, определением принципов организации корпуса по тематике нарративов. Тематическая классификация нарративов стала результатом анализа нескольких «контрольных» текстов. Она представляет собой ступенчатую систематизацию культурно-профессиональной тематики, поскольку, помимо основных (базовых) тем, может ...
Добавлено: 18 января 2025 г.
Статья посвящена анализу метрик лингвистической сложности текстов Виртуального визита по Главному музейному комплексу Государственного Эрмитажа, размещенного на сайте музея. Цель исследования – определить, в какой мере лингвистические характеристики данных текстов коррелируют с признаками виртуальной экскурсии по музею как речевого жанра. Значения метрик текстов виртуального визита анализируются на фоне значений аналогичных метрик научных искусствоведческих текстов и ...
Добавлено: 8 ноября 2024 г.
Галочкин А. Е., Филологические науки в МГИМО 2024 Т. 10 № 2 С. 23–37
В данной статье предпринимается попытка измерить популизм в англоязычных выступлениях политиков с использованием методов компьютерной лингвистики. Актуальность данного исследования связана не только с ростом популизма в мире и важностью понимания механизмов политического дискурса, но и недостатком лингвистических исследований в контексте корпусных исследований. Большинство предложенных на сегодняшний день методов требуют значительных ресурсов или страдают от структурных ...
Добавлено: 19 сентября 2024 г.
Анкудинов И. А., Мониторинг общественного мнения: Экономические и социальные перемены 2024 № 2 С. 153–177
Зафиксированный после 24 февраля 2022 г. патриотический подъем нашел своеобразное отражение в русскоязычном сегменте интернета. Хотя социологи почти единодушны в том, что социальное самочувствие граждан и их отношение к властям улучшились, цифровые следы этих изменений не так заметны: невооруженным взглядом видна только усилившаяся поляризация по линии «за — против». В работе измеряется непосредственный (краткосрочный) эффект, ...
Добавлено: 7 сентября 2024 г.
РГГУ, 2022.
Сборник включает 17 докладов международной конференции по компьютерной лингвистике и интеллектуальным технологиям «Диалог 2022», представляющих широкий спектр теоретических и прикладных исследований в области компьютерного моделирования естественного языка и создания новых лингвистических технологий. Для специалистов в области теоретической и прикладной лингвистики и интеллектуальных технологий. ...
Добавлено: 24 мая 2024 г.