• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • A
  • A
  • A
  • A
  • A
Обычная версия сайта
  • RU
  • EN
  • Национальный исследовательский университет «Высшая школа экономики»
  • Публикации ВШЭ
  • Статьи
  • Метод распознавания сентимента и эмоций в транскрипциях русскоязычной речи с использованием машинного перевода
  • RU
  • EN
Расширенный поиск
Высшая школа экономики
Национальный исследовательский университет
Приоритетные направления
  • бизнес-информатика
  • государственное и муниципальное управление
  • гуманитарные науки
  • инженерные науки
  • компьютерно-математическое
  • математика
  • менеджмент
  • право
  • социология
  • экономика
по году
  • 2027
  • 2026
  • 2025
  • 2024
  • 2023
  • 2022
  • 2021
  • 2020
  • 2019
  • 2018
  • 2017
  • 2016
  • 2015
  • 2014
  • 2013
  • 2012
  • 2011
  • 2010
  • 2009
  • 2008
  • 2007
  • 2006
  • 2005
  • 2004
  • 2003
  • 2002
  • 2001
  • 2000
  • 1999
  • 1998
  • 1997
  • 1996
  • 1995
  • 1994
  • 1993
  • 1992
  • 1991
  • 1990
  • 1989
  • 1988
  • 1987
  • 1986
  • 1985
  • 1984
  • 1983
  • 1982
  • 1981
  • 1980
  • 1979
  • 1978
  • 1977
  • 1976
  • 1975
  • 1974
  • 1973
  • 1972
  • 1971
  • 1970
  • 1969
  • 1968
  • 1967
  • 1966
  • 1965
  • 1964
  • 1963
  • 1958
  • еще
Тематика
Новости
19 мая 2026 г.
Физики НИУ ВШЭ выяснили, что происходит внутри устойчивого вихря
В атмосфере и в океане часто наблюдаются крупные вихри с характерными спиральными рукавами. Физики из НИУ ВШЭ объяснили, как они формируются и почему сохраняют свою структуру. Оказалось, что скорости в точках, расположенных вдоль одной дуги вихря, остаются связанными даже на больших расстояниях. При этом в направлении от центра вихря эта связь быстро ослабевает. Такие различия помогают объяснить образование рукавов и могут улучшить модели атмосферных и океанических течений. Результаты опубликованы в Physical Review Fluids.
18 мая 2026 г.
В Вышке прошла XXX юбилейная научно-техническая конференция имени Е.В. Арменского
Организатором научного события выступает Московский институт электроники и математики им. А.Н. Тихонова ВШЭ. В этом году главный инженерный студенческий форум проходил 30-й раз и собрал рекордное число участников. Студенты, аспиранты и молодые специалисты из 50 вузов и организаций России представили научно-исследовательские доклады в ИТ-области. Отдельная секция была посвящена научно-исследовательским работам школьников.
15 мая 2026 г.
В НИУ ВШЭ разрабатывают нейросеть для сферы науки и инноваций
Исследователи НИУ ВШЭ учат большие языковые модели понимать русскоязычную научную терминологию, увеличивая при этом их энергоэффективность. Адаптированная модель работает в 2,7 раза быстрее и требует на 73% меньше памяти, чем исходная открытая модель, что позволяет запускать ее на более доступном оборудовании. Программа прошла государственную регистрацию.

 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!

Публикации
  • Книги
  • Статьи
  • Главы в книгах
  • Препринты
  • Верификация публикаций
  • Расширенный поиск
  • Правила использования материалов
  • Наука в ВШЭ

?

Метод распознавания сентимента и эмоций в транскрипциях русскоязычной речи с использованием машинного перевода

Информатика и автоматизация (Труды СПИИРАН). 2024.
Двойникова А. А., Кагиров И. А., Карпов А. А.

В статье рассматривается проблема распознавания сентимента и эмоций пользователей в русскоязычных текстовых транскрипциях речи с использованием словарных методов и машинного перевода. Количество имеющихся информационных ресурсов для анализа сентимента текстовых сообщений на русском языке очень ограничено, что существенно затрудняет применение базовых методов анализа сентимента, а именно, предобработки текстов, векторизации с помощью тональных словарей, традиционных классификаторов. Для решения этой проблемы в статье вводится новый метод на основе автоматического машинного перевода русскоязычных текстов на английский язык. Частичный перевод предполагает перевод отдельных лексем, не включенных в русскоязычные тональные словари, тогда как полный перевод подразумевает перевод всего текста целиком. Переведенный текст анализируется с использованием различных англоязычных тональных словарей. Экспериментальные исследования для решения задачи распознавания сентимента и эмоций были проведены на текстовых транскрипциях многомодального русскоязычного корпуса RAMAS, извлеченных из аудиоданных экспертным путем и автоматически с использованием системы распознавания речи. В результате применения методов машинного перевода достигается значение взвешенной F-меры распознавания семи классов эмоций 31,12 % и 23,74 %, и трех классов сентимента 75,37 % и 71,60 % для экспертных и автоматических транскрипций русскоязычной речи корпуса RAMAS, соответственно. Также в ходе экспериментов было выявлено, что использование статистических векторов в качестве метода преобразования текстовых данных позволяет достичь значение показателя взвешенной F-меры на 1-5 % выше по сравнению с использованием конкатенированного (статистического и тонального) вектора. Таким образом, эксперименты показывают, что объединение всех англоязычных тональных словарей позволяет повысить точность распознавания сентимента и эмоций в текстовых данных. В статье также исследуется корреляция между длиной вектора текстовых данных и его репрезентативностью. По результатам экспериментов можно сделать вывод, что использование лемматизации для нормализации слов текстовых транскрипций речи позволяет достичь большей точности распознавания сентимента по сравнению со стеммингом. Использование предложенных методов с полным и частичным машинным переводом позволяет повысить точность распознавания сентимента и эмоций на 0,65–9,76 % по показателю взвешенной F-меры по сравнению с базовым методом распознавания сентимента и эмоций.

Язык: русский
DOI
Текст на другом сайте
Ключевые слова: распознавание эмоциймашинный переводсентимент-анализтональные словаритональные вектора
Похожие публикации
Аналитический обзор многомодальных корпусов данных для распознавания эмоций
Двойникова А. А., В кн.: Альманах научных работ молодых ученых Университета ИТМО.: Университет ИТМО, 2023.
В статье раскрываются достоинства и недостатки категориальных и пространственных моделей описания эмоций. Пространственные модели позволяют охватить более широкий спектр человеческих эмоций, что позволяет разработать наиболее эффективную систему распознавания эмоций. В работе проводится аналитический обзор существующих многомодальных корпусов данных, которые имеют разметку по валентности и интенсивности эмоций. В заключении выделяется наиболее репрезентативный корпус данных для автоматического ...
Добавлено: 25 апреля 2026 г.
Подход к автоматическому распознаванию эмоций в транскрипциях речи
Двойникова А. А., Кондратенко К. О., Известия высших учебных заведений. Приборостроение 2023 Т. 66 № 10 С. 818–827
Аннотация. Исследован актуальный в различных областях вопрос распознавания эмоций в транскрипциях речи. Проанализировано влияние методов предобработки (удаление стоп-слов, лемматизация, стемминг) на точность распознавания эмоций в текстовых данных на русском и английском языках. Для проведения экспериментальных исследований использовались орфографические транскрипции диалогов из многомодальных корпусов RAMAS и CMU-MOSEI на русском и английском языке соответственно. Аннотирование этих корпусов ...
Добавлено: 25 апреля 2026 г.
Сентимент-анализ транскрипции разговорной речи при помощи автоматического машинного перевода
Двойникова А. А., В кн.: Сборник трудов IX конгресса молодых ученыхТ. 1.: Университет ИТМО, 2021.
Зачастую коммуникация людей происходит посредством вербального общения. Для распознавания эмоций в речевых высказываниях необходимо анализировать текстовую модальность, т.к. она передает полярность эмоций. В статье описываются способы автоматического распознавания речи, а также предлагается подход сентимент-анализа транскрипции русскоязычной речи на основе тональных словарей. Так как русскоязычные ресурсы до сих пор уступают по объему и качеству англоязычным, приводится ...
Добавлено: 24 апреля 2026 г.
Автоматическое определение эмоционального состояния участников предметных разговоров по транскрипциям речи
Двойникова А. А., Мамонтов Д. Ю., Карпов А. А., В кн.: Альманах научных работ молодых ученых Университета ИТМОТ. 3.: Университет ИТМО, 2021. С. 63–68.
В работе проводятся экспериментальные исследования по определению уровня эмоциональных проявлений в текстовых транскрипциях базы данных K-EmoCon. Рассматривается влияние сбалансирования классов при обучении классификаторов на точность определения эмоций. В статье устанавливается базовый стандарт результатов по классификации уровня эмоций дикторов в текстовых транскрипциях. ...
Добавлено: 24 апреля 2026 г.
Сентимент-анализ разговорной речи при помощи метода, основанного на тональных словарях
Двойникова А. А., Верхоляк О. В., Карпов А. А., В кн.: Альманах научных работ молодых ученых Университета ИТМОТ. 3.: Университет ИТМО, 2020.
В работе предлагается метод, основанный на тональных словарях, для анализа тональности разговорной речи. Для проведения экспериментов используются транскрипции аудиозаписей базы данных RAMAS, полученные с помощью систем автоматического распознавания речи. Машинная классификация данных производится на 3 класса: позитивный, нейтральный и негативный с использованием русскоязычных тональных словарей RuSentiLex, LinisCrowd, WordNetAffect и словаря Белякова. ...
Добавлено: 24 апреля 2026 г.
Аналитический обзор подходов к распознаванию тональности русскоязычных текстовых данных
Двойникова А. А., Карпов А. А., Информационно-управляющие системы 2020 № 4 (107) С. 20–30
Введение: в  последние годы анализ тональности, или сентимент-анализ, высказываний пользователей находит практическое применение во многих областях: оценка качества товаров и услуг по отзывам покупателей в Интернете, анализ негативных эмоций в сообщениях, прогноз фондовых рынков, политических ситуаций на основе новостных лент и многих других. В связи с этим разрабатываются разнообразные системы и методы для сентимент-анализа русскоязычных текстовых данных. Цель: выполнение ...
Добавлено: 24 апреля 2026 г.
Оценка качества использования больших языковых моделей в задачах машинного перевода
Мыльникова А. В., Мыльников Л. А., Научно-техническая информация. Серия 2: Информационные процессы и системы 2026 № 2 С. 24–33
Представлены результаты сравнительной оценки качества машинного перевода, выполненного большими языковыми моделями (LLM): DeepSeek, Grok, Mistral, Qwen, GigaChat, Yandex, на основе перевода выразительных языковых средств (фразеологизмов, омонимов, каламбуров и т.д.) и текстов различных функциональных стилей. Качество перевода оценивалось количественно с помощью метрик когерентности (BLEU, METEOR, chrF) и качественно — путем экспертного анализа на соответствие критериям адекватности, ...
Добавлено: 27 февраля 2026 г.
Онлайн-дискурс о демографической политике Китая: методологические аспекты анализа постов в социальной сети Weibo
Бочарова А. П., Денисов И. Е., Зуенко И. Ю., Вестник Санкт-Петербургского университета. Востоковедение и африканистика 2025 Т. 17 № 2 С. 366–377
Статья посвящена анализу восприятия современным китайским обществом недавних изменений в демографической политике КНР, в соответствии с которыми ограничения на количество детей в семье смягчены сначала до двух (2015 г.), а затем до трех детей в семье (2021 г.). Демографическая политика — один из наиболее сложных и вместе с тем значимых аспектов социальной политики КНР с ...
Добавлено: 19 февраля 2026 г.
Императивный интернет-комментарий как особый жанр конфликтной интернет-коммуникации
Шульгинов В. А., Жанры речи 2025 Т. 20 № 3(47) С. 327–336
В статье рассматривается императивный интернет-комментарий как особый жанр конфликтного интернет-дискурса. Исследование проводилось на базе двух сообществ социальной сети «ВКонтакте», различающихся по структуре социальных связей: вертикального типа (официальное сообщество «ВКонтакте с авторами») и горизонтального типа («Новости звёзд шоу-бизнеса»). С применением автоматических методов сбора и анализа данных было установлено, что данный тип текста демонстрирует устойчивую негативную тональность ...
Добавлено: 12 октября 2025 г.
Языковые модели для предобработки текстов в машинном переводе
Мыльникова А. В., Мыльников Л. А., Научно-техническая информация. Серия 2: Информационные процессы и системы 2025 № 7 С. 32–44
Рассмотрена модель использования скелетных структур на базе синтаксической разметки для предобработки корпусов текстов перед передачей в нейросетевые модели машинного перевода с целью повышения качества их работы, реализованная с помощью частеречной и синтаксической разметок корпусов текстов, использующих языковую модель, с использованием сети BERT и набора правил. Описана подготовка данных для обучения и предложены способы повышения эффективности ...
Добавлено: 22 сентября 2025 г.
CA-SER: Cross-Attention Feature Fusion for Speech Emotion Recognition
Deeb B., Савченко А. В., Макаров И. А., , in: ECAI 2024. 27th European Conference on Artificial Intelligence, October 19 – 24 October 2024, Santiago de Compostela, Spain – Including 13th Conference on Prestigious Applications of Intelligent Systems (PAIS 2024).: IOS Press, 2024. P. 4479–4482.
Добавлено: 15 февраля 2025 г.
Представленность России в британских онлайн-источниках в 2022 г.
Шариков А. В., Вестник Российского университета дружбы народов. Серия: Литературоведение, журналистика 2024 Т. 29 № 3 С. 534–550
Выявлены особенности репрезентации россии в британских онлайн-источниках в 2022 г., когда началась специальная военная операция на украине. автор использовал статистический анализ на основе мониторинговой системы factiva: база данных содержит около 4,5 млн текстов, опубликованных на 416 британских онлайн-ресурсах с 1 января по 31 декабря 2022 г. Для определения тональности сообщений использовался сентимент-анализ (версия системы factiva). ...
Добавлено: 5 февраля 2025 г.
О соотношении сообщений позитивной и негативной тональности на русскоязычных информационных онлайн-ресурсах
Шариков А. В., Потапова В. В., Вестник Академии медиаиндустрии 2023 Т. 34 № 2 С. 48–64
В статье приводятся результаты исследования, проведенного в НИУ «Высшая школа экономики» на корпусе текстов мониторинговой системы Factiva, опубликованных в 2020 году. Цель исследования - выявить количественное соотношение между публикациями позитивной и негативной тональности на русскоязычных онлайн-ресурсах в сравнении с публикациями зарубежных изданий на иностранных языках. Обнаружен заметный сдвиг русскоязычных материалов в негативную тональность. Обнаружена связь ...
Добавлено: 5 февраля 2025 г.
Неклассический подход к созданию базы эмоциональных лиц: за рамками теории базовых эмоций
Петракова А. В., Юрчик Е. Н., Лебедева Е. И., В кн.: Лицо человека в системах коммуникации.: М.: Московский институт психоанализа, 2024. Гл. 10 С. 138–147.
Добавлено: 7 января 2025 г.
Опыт создания российской базы лиц, изображающих различные эмоции: первый этап
Петракова А. В., Лебедева Е. И., Кузьмина Ю. В. и др., Психология. Журнал Высшей школы экономики 2024 Т. 21 № 2 С. 423–431
Настоящая работа представляет собой пилотажное исследование, направленное на создание и тестирование стимульного материала, представляющего собой фотоизображения лиц взрослых и детей, выражающих различные эмоции. Уникальность проведенной работы обусловлена таким подходом к организации создания стимульного материала, в рамках которого модели демонстрировали бы эмоции не по установленной схеме мимических движений, соответствующих конкретной эмоции, а согласно своим представлениям о ...
Добавлено: 26 декабря 2024 г.
Распознавание эмоций в соотнесении к «эмоциональным семействам»
Петракова А. В., Лебедева Е. И., Юрчик Е. Н., Экспериментальная психология 2024 Т. 17 № 3 С. 4–15
Работа направлена на изучение успешности распознавания эмоций людей разного пола и возраста, выраженных без заданных критериев, в соотнесении их с «эмоциональными семействами». Представлены материалы эмпирического онлайн-исследования, полученные при помощи краудсорсингового сервиса «Яндекс. Толока», в рамках которого приняли участие 3590 респондентов. Респонденты распознавали одну из 14 эмоций по предъявленным фотографиям (гордость, злость, радость, раздражение, веселье, отвращение, ...
Добавлено: 26 декабря 2024 г.
Поможет ли Байесовская сыворотка правды повысить достоверность разметки эмоциональных текстов? (case study)
Колмогорова А. В., Хлебникова В. А., Человек: образ и сущность. Гуманитарные аспекты 2025 № 2(62) С. 45–68
В статье рассматриваются результаты применения методологии, известной как Байесовская сыворотка правды (BTS), в задаче эмоциональной разметки текстов для последующего обучения нейросетевых моделей. Суть метода состоит в том, что информантов сначала просят оценить некоторый феномен со своей собственной точки зрения, а затем – предсказать, какой ответ (или оценку) выберет наибольший процент других отвечающих на тот же ...
Добавлено: 29 ноября 2024 г.
Через годы, через расстояния…: динамика эмоциональной тональности и ключевых тем в текстах песен о Великой Отечественной войне с 1965 по 1990 годы (на материале корпуса советских песен)
Колмогорова А. В., Колмогорова П. А., Куликова Е. Р., Вестник Томского государственного университета 2024 № 508 С. 65–76
Статья посвящена описанию специфики дискурсивизации темы войны в песнях о Великой Отечественной войне, выпущенных звукозаписывающей компанией «Мелодия» за четыре десятилетия ХХ в.: 60-е, 70-е, 80-е, 90-е годы. Применение методов компьютерной лингвистики позволило получить данные о специфике распределения тем в текстах песен каждого из десятилетий и о ведущей эмоциональной тональности. Выявлено, что, в целом, особенности дискурсивной репрезентации темы войны в ...
Добавлено: 29 ноября 2024 г.
Специфика разметки мультимодального корпуса эмоциональной речи
Куликова Е. Р., В кн.: Лингвистическая семантика в пространственном измерении: Словарь. Дискурс. Корпус.: Екатеринбург: Кабинетный ученый, 2024. Гл. 9.1 С. 399–411.
Добавлено: 29 ноября 2024 г.
Повышение качества перевода при использовании методов изменения порядка слов при предобработке текстов для систем машинного перевода
Мыльникова А. В., Чернышева П. А., Научно-техническая информация. Серия 1. Организация и методика информационной работы 2024 № 2 С. 26–35
Рассматривается проблема, связанная с потерей смысла и связности изложения при машинном переводе между естественными языками. Цель исследования - изучение возможностей применения соответствий пар скелетных структур текста для повышения качества перевода. Показаны методы изменения порядка слов в системах машинного перевода, использующих нейронные сети и статистические методы. Выполнен сравнительный анализ качества получаемого перевода, сделаны выводы о формах ...
Добавлено: 3 апреля 2024 г.
  • О ВЫШКЕ
  • Цифры и факты
  • Руководство и структура
  • Устойчивое развитие в НИУ ВШЭ
  • Преподаватели и сотрудники
  • Корпуса и общежития
  • Закупки
  • Обращения граждан в НИУ ВШЭ
  • Фонд целевого капитала
  • Противодействие коррупции
  • Сведения о доходах, расходах, об имуществе и обязательствах имущественного характера
  • Сведения об образовательной организации
  • Людям с ограниченными возможностями здоровья
  • Единая платежная страница
  • Работа в Вышке
  • ОБРАЗОВАНИЕ
  • Лицей
  • Довузовская подготовка
  • Олимпиады
  • Прием в бакалавриат
  • Вышка+
  • Прием в магистратуру
  • Аспирантура
  • Дополнительное образование
  • Центр развития карьеры
  • Бизнес-инкубатор ВШЭ
  • Образовательные партнерства
  • Обратная связь и взаимодействие с получателями услуг
  • НАУКА
  • Научные подразделения
  • Исследовательские проекты
  • Мониторинги
  • Диссертационные советы
  • Защиты диссертаций
  • Академическое развитие
  • Конкурсы и гранты
  • Внешние научно-информационные ресурсы
  • РЕСУРСЫ
  • Библиотека
  • Издательский дом ВШЭ
  • Книжный магазин «БукВышка»
  • Типография
  • Медиацентр
  • Журналы ВШЭ
  • Публикации
  • http://www.minobrnauki.gov.ru/
    Министерство науки и высшего образования РФ
  • https://edu.gov.ru/
    Министерство просвещения РФ
  • http://www.edu.ru
    Федеральный портал «Российское образование»
  • https://elearning.hse.ru/mooc
    Массовые открытые онлайн-курсы
  • НИУ ВШЭ1993–2026
  • Адреса и контакты
  • Условия использования материалов
  • Политика конфиденциальности
  • Правила применения рекомендательных технологий в НИУ ВШЭ
  • Карта сайта
Редактору