• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • A
  • A
  • A
  • A
  • A
Обычная версия сайта
  • RU
  • EN
  • Национальный исследовательский университет «Высшая школа экономики»
  • Публикации ВШЭ
  • Статьи
  • Аналитический обзор подходов к распознаванию тональности русскоязычных текстовых данных
  • RU
  • EN
Расширенный поиск
Высшая школа экономики
Национальный исследовательский университет
Приоритетные направления
  • бизнес-информатика
  • государственное и муниципальное управление
  • гуманитарные науки
  • инженерные науки
  • компьютерно-математическое
  • математика
  • менеджмент
  • право
  • социология
  • экономика
по году
  • 2027
  • 2026
  • 2025
  • 2024
  • 2023
  • 2022
  • 2021
  • 2020
  • 2019
  • 2018
  • 2017
  • 2016
  • 2015
  • 2014
  • 2013
  • 2012
  • 2011
  • 2010
  • 2009
  • 2008
  • 2007
  • 2006
  • 2005
  • 2004
  • 2003
  • 2002
  • 2001
  • 2000
  • 1999
  • 1998
  • 1997
  • 1996
  • 1995
  • 1994
  • 1993
  • 1992
  • 1991
  • 1990
  • 1989
  • 1988
  • 1987
  • 1986
  • 1985
  • 1984
  • 1983
  • 1982
  • 1981
  • 1980
  • 1979
  • 1978
  • 1977
  • 1976
  • 1975
  • 1974
  • 1973
  • 1972
  • 1971
  • 1970
  • 1969
  • 1968
  • 1967
  • 1966
  • 1965
  • 1964
  • 1963
  • 1958
  • еще
Тематика
Новости
20 мая 2026 г.
«Еж» против «родственника»: ученые измерили, как мозг реагирует на неожиданные слова в живой речи
Российские нейрофизиологи с участием исследователей из НИУ ВШЭ показали, что изучать восприятие живой речи можно с помощью вызванных потенциалов. Они доказали, что метод применим не только к отдельным словам, но и к непрерывной речи. Оказалось, что слова, сильно отличающиеся по смыслу от предыдущего контекста, мозг обрабатывает дольше, а служебные слова анализирует в два этапа: сначала определяет их грамматическую роль, а затем на этой основе предсказывает следующее слово. Исследование опубликовано в журнале Frontiers in Human Neuroscience.
20 мая 2026 г.
Творческая работа как лекарство от выгорания
Творческая и доброжелательная атмосфера, новые методы в Международной лаборатории (впоследствии центре) социокультурных исследований привлекают молодых исследователей. За годы работы в Вышке они становятся учеными и преподавателями, известными в России и за рубежом. О своем пути в центре и в Вышке, исследованиях и роли наставников в научных успехах рассказали главный научный сотрудник ЦСКИ Зарина Лепшокова и ведущий научный сотрудник Екатерина Бушина.
19 мая 2026 г.
Физики НИУ ВШЭ выяснили, что происходит внутри устойчивого вихря
В атмосфере и в океане часто наблюдаются крупные вихри с характерными спиральными рукавами. Физики из НИУ ВШЭ объяснили, как они формируются и почему сохраняют свою структуру. Оказалось, что скорости в точках, расположенных вдоль одной дуги вихря, остаются связанными даже на больших расстояниях. При этом в направлении от центра вихря эта связь быстро ослабевает. Такие различия помогают объяснить образование рукавов и могут улучшить модели атмосферных и океанических течений. Результаты опубликованы в Physical Review Fluids.

 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!

Публикации
  • Книги
  • Статьи
  • Главы в книгах
  • Препринты
  • Верификация публикаций
  • Расширенный поиск
  • Правила использования материалов
  • Наука в ВШЭ

?

Аналитический обзор подходов к распознаванию тональности русскоязычных текстовых данных

Информационно-управляющие системы. 2020. № 4 (107). С. 20–30.
Двойникова А. А., Карпов А. А.

Введение: в  последние годы анализ тональности, или сентимент-анализ, высказываний пользователей находит практическое применение во многих областях: оценка качества товаров и услуг по отзывам покупателей в Интернете, анализ негативных эмоций в сообщениях, прогноз фондовых рынков, политических ситуаций на основе новостных лент и многих других. В связи с этим разрабатываются разнообразные системы и методы для сентимент-анализа русскоязычных текстовых данных. Цель: выполнение подробного обзора подходов и сравнительного анализа существующих баз данных в области сентимент-анализа текстов на русском языке. Результаты: аналитический обзор подходов к анализу тональности русскоязычных текстовых данных показал, что для сентимент-анализа текстов сейчас имеется множество разнообразных методов предобработки текстовых данных, их векторизации и машинной классификации. Из сравнительного анализа существующих баз данных по данной тематике можно сделать вывод, что автоматический сентимент-анализ русскоязычных текстов развит значительно меньше, чем для других основных мировых языков. Исследование программных систем для анализа текстов на русском языке демонстрирует, что пока русскоязычный анализ тональности показывает относительно низкую точность по сравнению с англоязычным, одной из причин этого может являться сложная структура русского языка. В статье описываются основные нерешенные проблемы анализа тональности русскоязычных текстов. Обсуждение: в дальнейших исследованиях планируется реализовать сентимент-анализ разговорной речи дикторов с использованием аудиоданных, для чего необходимо сначала получить орфографическую транскрипцию речи для каждого диктора.

Язык: русский
Полный текст
DOI
Текст на другом сайте
Ключевые слова: сентимент-анализкомпьютерная паралингвистикатональность текстовых данныхвекторизация текста
Похожие публикации
Метод распознавания сентимента и эмоций в транскрипциях русскоязычной речи с использованием машинного перевода
Двойникова А. А., Кагиров И. А., Карпов А. А., Информатика и автоматизация (Труды СПИИРАН) 2024
В статье рассматривается проблема распознавания сентимента и эмоций пользователей в русскоязычных текстовых транскрипциях речи с использованием словарных методов и машинного перевода. Количество имеющихся информационных ресурсов для анализа сентимента текстовых сообщений на русском языке очень ограничено, что существенно затрудняет применение базовых методов анализа сентимента, а именно, предобработки текстов, векторизации с помощью тональных словарей, традиционных классификаторов. Для ...
Добавлено: 25 апреля 2026 г.
Сентимент-анализ транскрипции разговорной речи при помощи автоматического машинного перевода
Двойникова А. А., В кн.: Сборник трудов IX конгресса молодых ученыхТ. 1.: Университет ИТМО, 2021.
Зачастую коммуникация людей происходит посредством вербального общения. Для распознавания эмоций в речевых высказываниях необходимо анализировать текстовую модальность, т.к. она передает полярность эмоций. В статье описываются способы автоматического распознавания речи, а также предлагается подход сентимент-анализа транскрипции русскоязычной речи на основе тональных словарей. Так как русскоязычные ресурсы до сих пор уступают по объему и качеству англоязычным, приводится ...
Добавлено: 24 апреля 2026 г.
Сентимент-анализ разговорной речи при помощи метода, основанного на тональных словарях
Двойникова А. А., Верхоляк О. В., Карпов А. А., В кн.: Альманах научных работ молодых ученых Университета ИТМОТ. 3.: Университет ИТМО, 2020.
В работе предлагается метод, основанный на тональных словарях, для анализа тональности разговорной речи. Для проведения экспериментов используются транскрипции аудиозаписей базы данных RAMAS, полученные с помощью систем автоматического распознавания речи. Машинная классификация данных производится на 3 класса: позитивный, нейтральный и негативный с использованием русскоязычных тональных словарей RuSentiLex, LinisCrowd, WordNetAffect и словаря Белякова. ...
Добавлено: 24 апреля 2026 г.
Онлайн-дискурс о демографической политике Китая: методологические аспекты анализа постов в социальной сети Weibo
Бочарова А. П., Денисов И. Е., Зуенко И. Ю., Вестник Санкт-Петербургского университета. Востоковедение и африканистика 2025 Т. 17 № 2 С. 366–377
Статья посвящена анализу восприятия современным китайским обществом недавних изменений в демографической политике КНР, в соответствии с которыми ограничения на количество детей в семье смягчены сначала до двух (2015 г.), а затем до трех детей в семье (2021 г.). Демографическая политика — один из наиболее сложных и вместе с тем значимых аспектов социальной политики КНР с ...
Добавлено: 19 февраля 2026 г.
Императивный интернет-комментарий как особый жанр конфликтной интернет-коммуникации
Шульгинов В. А., Жанры речи 2025 Т. 20 № 3(47) С. 327–336
В статье рассматривается императивный интернет-комментарий как особый жанр конфликтного интернет-дискурса. Исследование проводилось на базе двух сообществ социальной сети «ВКонтакте», различающихся по структуре социальных связей: вертикального типа (официальное сообщество «ВКонтакте с авторами») и горизонтального типа («Новости звёзд шоу-бизнеса»). С применением автоматических методов сбора и анализа данных было установлено, что данный тип текста демонстрирует устойчивую негативную тональность ...
Добавлено: 12 октября 2025 г.
Представленность России в британских онлайн-источниках в 2022 г.
Шариков А. В., Вестник Российского университета дружбы народов. Серия: Литературоведение, журналистика 2024 Т. 29 № 3 С. 534–550
Выявлены особенности репрезентации россии в британских онлайн-источниках в 2022 г., когда началась специальная военная операция на украине. автор использовал статистический анализ на основе мониторинговой системы factiva: база данных содержит около 4,5 млн текстов, опубликованных на 416 британских онлайн-ресурсах с 1 января по 31 декабря 2022 г. Для определения тональности сообщений использовался сентимент-анализ (версия системы factiva). ...
Добавлено: 5 февраля 2025 г.
О соотношении сообщений позитивной и негативной тональности на русскоязычных информационных онлайн-ресурсах
Шариков А. В., Потапова В. В., Вестник Академии медиаиндустрии 2023 Т. 34 № 2 С. 48–64
В статье приводятся результаты исследования, проведенного в НИУ «Высшая школа экономики» на корпусе текстов мониторинговой системы Factiva, опубликованных в 2020 году. Цель исследования - выявить количественное соотношение между публикациями позитивной и негативной тональности на русскоязычных онлайн-ресурсах в сравнении с публикациями зарубежных изданий на иностранных языках. Обнаружен заметный сдвиг русскоязычных материалов в негативную тональность. Обнаружена связь ...
Добавлено: 5 февраля 2025 г.
Через годы, через расстояния…: динамика эмоциональной тональности и ключевых тем в текстах песен о Великой Отечественной войне с 1965 по 1990 годы (на материале корпуса советских песен)
Колмогорова А. В., Колмогорова П. А., Куликова Е. Р., Вестник Томского государственного университета 2024 № 508 С. 65–76
Статья посвящена описанию специфики дискурсивизации темы войны в песнях о Великой Отечественной войне, выпущенных звукозаписывающей компанией «Мелодия» за четыре десятилетия ХХ в.: 60-е, 70-е, 80-е, 90-е годы. Применение методов компьютерной лингвистики позволило получить данные о специфике распределения тем в текстах песен каждого из десятилетий и о ведущей эмоциональной тональности. Выявлено, что, в целом, особенности дискурсивной репрезентации темы войны в ...
Добавлено: 29 ноября 2024 г.
Цифровые технологии в лингвистических исследованиях
Колмогорова А. В., М.: АйПиАр Медиа, 2024.
В учебнике рассматриваются основные ресурсы и инструменты, использование которых окажет существенную методологическую поддержку при проведении лингвистических исследований различного уровня и проблематики. Теоретический материал иллюстрируется практическими кейсами из опыта работы автора. В издании использованы результаты проекта «Текст как Big Data: моделирование конвергентных процессов в языке и речи цифровыми методами», выполненного в рамках Программы фундаментальных исследований НИУ ...
Добавлено: 18 марта 2024 г.
Исследовательский потенциал корпуса советских песен: эмоциональная тональность и география песенных текстов через призму компьютерных технологий
Колмогорова А. В., Зарембо В. С., Ткачева Е. С. и др., В кн.: Лингвистическая семантика в пространственном измерении: Словарь. Дискурс. Корпус.: Екатеринбург: Кабинетный ученый, 2024. Гл. 10 С. 423–445.
Цель данного исследования – описать характеристики текста популярной советской песни как лингвоидеологического феномена. В качестве материала используется корпус советской песни, собранный исследовательской группой. В фокусе данной публикации – две характеристики: изменения эмоциональной тональности популярных песен, выпускавшихся на граммпластинках фирмой «Мелодия» в разные периоды советской эпохи, и города, упоминавшиеся в песнях с 1950 по 2000 гг. ...
Добавлено: 10 декабря 2023 г.
О прошлом, но в разное время: компьютерный анализ текстов учебников по истории СССР/России для шести поколений студентов
Колмогорова А. В., Колмогорова П. А., Куликова Е. Р., Вестник Томского государственного университета. Филология 2024 № 89 С. 73–103
В статье анализируются тексты о семи периодах российской истории в трех вузовских учебниках: 1946, 1983 и 2006 годов. С помощью методов компьютерного анализа текстовых данных выявляется специфика поколенческого нарратива об истории страны в указанные три временных периода. Результаты демонстрируют, что тексты разных лет имеют различных эмоциональный «размах», разные тематические доминанты, которые связаны с «духом» соответствующего ...
Добавлено: 10 декабря 2023 г.
От любви до ненависти: распределение эмоциональной лексики в русском рассказе начала XX века
Москвина А. Д., Кирина М. А., В кн.: Труды международной конференции «Корпусная лингвистика — 2023».: СПб.: Издательство Санкт-Петербургского государственного университета, 2024. С. 156–166.
Статья представляет результаты экспериментов, исследующих распределение эмоциональной лексики в русском рассказе первой трети XX века. Эмоциональность слов и текстов определяется автоматически с помощью методов дистрибутивной семантики, что не требует использования словарей или предварительной разметки данных. Результатом стали данные о распределениях эмоциональной лексики по рассказам, а также сопоставление автоматически полученных данных с читательской оценкой. Самым эмоционально ...
Добавлено: 9 декабря 2023 г.
Сентимент-анализ как метод исследования информационной повестки и общественного мнения (на примере СМИ и социальных сетей КНР)
Анташева М. С., Лобанова П. А., Исаева Ю. К. и др., Социология: методология, методы, математическое моделирование 2023 № 57 С. 7–41
Информационная повестка, транслируемая китайскими медиаресурсами, является источником актуальных данных о мнении общества в отношении ключевых вопросов социального благосостояния. Вследствие технических особенностей организации китайских веб-сайтов и необходимости привлечения дополнительных ресурсов для автоматической обработки (парсинга) текстов на китайском языке, данная тематика не представлена достаточно широко в отечественных и зарубежных исследованиях. Целью настоящей работы является демонстрация методологии и ...
Добавлено: 9 ноября 2023 г.
ВИЗУАЛИЗАЦИЯ ДАННЫХ В ЭМОЦИОНАЛЬНОМ АНАЛИЗЕ РУССКОЯЗЫЧНЫХ ИНТЕРНЕТ-ТЕКСТОВ НА ОСНОВЕ МОДЕЛИ "КУБ ЛЁВХЕЙМА"
Колмогорова А. В., Калинин А. А., В кн.: Язык и искусственный интеллект: Сборник статей по итогам конференции «Лингвистический форум 2020: Язык и искусственный интеллект».: Издательский дом ЯСК, 2023. С. 167–181.
В данной публикации рассматривается специфика и эвристика средств визуализации данных, полученных в результате применения алгоритмов анализа эмоций в тексте. Дан общий обзор применения техник визуализации для задач сентимент-анализа и анализа эмоций. Предложены варианты визуализации эмоционального представления текстов, анализируемых в рамках теоретического подхода «Куб Лёвхейма», в котором эмоция представляется в виде комбинации трех нейротрансмиттеров. Подобная модель ...
Добавлено: 31 октября 2023 г.
Язык и искусственный интеллект: Сборник статей по итогам конференции «Лингвистический форум 2020: Язык и искусственный интеллект»
Издательский дом ЯСК, 2023.
В сборнике представлены статьи участников «Лингвистического форума 2020: Язык и искусственный интеллект» (конференции, ноябрь 2020, РАН), отражающие общую и частную проблематику научных исследований в области лингвистики и компьютерных технологий. Авторы публикуемых статей предлагают решения специальных вопросов на фоне более масштабных объектов научной эвристики, обязательных при разработке и применении искусственного интеллекта: мозг, сознание, мышление, дискретность/недискретность единиц ...
Добавлено: 31 октября 2023 г.
Emotions and Monoamines: New Approach to the Emotional Text Classification in Sentiment Analysis
Колмогорова А. В., Advances in Intelligent Systems and Computing 2021 No. 3 P. 375–384
Добавлено: 30 октября 2022 г.
АНТИМИГРАНТСКАЯ РИТОРИКА В БРИТАНСКИХ СМИ ДО И ПОСЛЕ РЕФЕРЕНДУМА
Балакина Ю. В., Галочкин А. Е., Вестник Пермского университета. Серия: Политология 2020 № 4 С. 115–126
Актуальность представляемого исследования обусловлена отсутствием работ сравнительного характера, в фокусе которых находится британский антимигрантский медиа-дискурс двух ключевых периодов в новейшей истории миграционной политики – до и после Брексит. Методологической основой работы послужили теории социальных акторов ван Левена (2008), концептуальная оппозиция «свой – чужой» Т. ван Дейка (1989), а также теория установления повестки дня М. МакКомбса и ...
Добавлено: 23 декабря 2020 г.
  • О ВЫШКЕ
  • Цифры и факты
  • Руководство и структура
  • Устойчивое развитие в НИУ ВШЭ
  • Преподаватели и сотрудники
  • Корпуса и общежития
  • Закупки
  • Обращения граждан в НИУ ВШЭ
  • Фонд целевого капитала
  • Противодействие коррупции
  • Сведения о доходах, расходах, об имуществе и обязательствах имущественного характера
  • Сведения об образовательной организации
  • Людям с ограниченными возможностями здоровья
  • Единая платежная страница
  • Работа в Вышке
  • ОБРАЗОВАНИЕ
  • Лицей
  • Довузовская подготовка
  • Олимпиады
  • Прием в бакалавриат
  • Вышка+
  • Прием в магистратуру
  • Аспирантура
  • Дополнительное образование
  • Центр развития карьеры
  • Бизнес-инкубатор ВШЭ
  • Образовательные партнерства
  • Обратная связь и взаимодействие с получателями услуг
  • НАУКА
  • Научные подразделения
  • Исследовательские проекты
  • Мониторинги
  • Диссертационные советы
  • Защиты диссертаций
  • Академическое развитие
  • Конкурсы и гранты
  • Внешние научно-информационные ресурсы
  • РЕСУРСЫ
  • Библиотека
  • Издательский дом ВШЭ
  • Книжный магазин «БукВышка»
  • Типография
  • Медиацентр
  • Журналы ВШЭ
  • Публикации
  • http://www.minobrnauki.gov.ru/
    Министерство науки и высшего образования РФ
  • https://edu.gov.ru/
    Министерство просвещения РФ
  • http://www.edu.ru
    Федеральный портал «Российское образование»
  • https://elearning.hse.ru/mooc
    Массовые открытые онлайн-курсы
  • НИУ ВШЭ1993–2026
  • Адреса и контакты
  • Условия использования материалов
  • Политика конфиденциальности
  • Правила применения рекомендательных технологий в НИУ ВШЭ
  • Карта сайта
Редактору