• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • A
  • A
  • A
  • A
  • A
Обычная версия сайта
  • RU
  • EN
  • Национальный исследовательский университет «Высшая школа экономики»
  • Публикации ВШЭ
  • Глава
  • СОВРЕМЕННОЕ СОСТОЯНИЕ И ТЕНДЕНЦИИ РАЗВИТИЯ РЕЧЕВЫХ ТЕХНОЛОГИЙ
  • RU
  • EN
Расширенный поиск
Высшая школа экономики
Национальный исследовательский университет
Приоритетные направления
  • бизнес-информатика
  • государственное и муниципальное управление
  • гуманитарные науки
  • инженерные науки
  • компьютерно-математическое
  • математика
  • менеджмент
  • право
  • социология
  • экономика
по году
  • 2027
  • 2026
  • 2025
  • 2024
  • 2023
  • 2022
  • 2021
  • 2020
  • 2019
  • 2018
  • 2017
  • 2016
  • 2015
  • 2014
  • 2013
  • 2012
  • 2011
  • 2010
  • 2009
  • 2008
  • 2007
  • 2006
  • 2005
  • 2004
  • 2003
  • 2002
  • 2001
  • 2000
  • 1999
  • 1998
  • 1997
  • 1996
  • 1995
  • 1994
  • 1993
  • 1992
  • 1991
  • 1990
  • 1989
  • 1988
  • 1987
  • 1986
  • 1985
  • 1984
  • 1983
  • 1982
  • 1981
  • 1980
  • 1979
  • 1978
  • 1977
  • 1976
  • 1975
  • 1974
  • 1973
  • 1972
  • 1971
  • 1970
  • 1969
  • 1968
  • 1967
  • 1966
  • 1965
  • 1964
  • 1963
  • 1958
  • еще
Тематика
Новости
22 мая 2026 г.
Лаборатория живых смыслов: как проект НИУ ВШЭ и СахГУ переосмысляет труд
Проект «Зеркальные лаборатории» НИУ ВШЭ — Пермь и Сахалинского государственного университета (СахГУ) изучает, как культура, среда и технологии формируют и меняют трудовые смыслы. Исследование объединяет индивидуальный опыт, профессиональные нормы, городские проблемы, творческие практики и цифровые условия труда. Руководитель Лаборатории междисциплинарных исследований по антропологии труда НИУ ВШЭ в Перми Лилия Пантелеева рассказала о работе проекта.
21 мая 2026 г.
«Пик глупости» и «долина отчаяния»: экономисты НИУ ВШЭ предложили объяснение эффекта Даннинга - Крюгера
Эффект Даннинга — Крюгера, который описывает резкий всплеск уверенности в своих силах у новичков и такое же стремительное ее падение при наборе опыта, объясняется особенностями процесса обучения и набора новых знаний. К такому выводу пришли сотрудник факультета экономических наук НИУ ВШЭ Андрей Ворчик вместе с независимым исследователем Муратом Мамышевым. Они разработали математическую модель процесса обучения и показали, как формируется и изменяется субъективная уверенность по мере накопления знаний и как  преподаватель может уменьшить «долину отчаяния» для ученика.
20 мая 2026 г.
«Еж» против «родственника»: ученые измерили, как мозг реагирует на неожиданные слова в живой речи
Российские нейрофизиологи с участием исследователей из НИУ ВШЭ показали, что изучать восприятие живой речи можно с помощью вызванных потенциалов. Они доказали, что метод применим не только к отдельным словам, но и к непрерывной речи. Оказалось, что слова, сильно отличающиеся по смыслу от предыдущего контекста, мозг обрабатывает дольше, а служебные слова анализирует в два этапа: сначала определяет их грамматическую роль, а затем на этой основе предсказывает следующее слово. Исследование опубликовано в журнале Frontiers in Human Neuroscience.

 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!

Публикации
  • Книги
  • Статьи
  • Главы в книгах
  • Препринты
  • Верификация публикаций
  • Расширенный поиск
  • Правила использования материалов
  • Наука в ВШЭ

?

СОВРЕМЕННОЕ СОСТОЯНИЕ И ТЕНДЕНЦИИ РАЗВИТИЯ РЕЧЕВЫХ ТЕХНОЛОГИЙ

С. 19–25.
Харламов А. А., Чучупал В. Я.

За сравнительно короткий отрезок времени в области речевых технологий произошли фундаментальные изменения, которые привели к резкому улучшению характеристик математического и программного обеспечения для обработки речи, обусловили появление практических решений такого уровня, что использование речевых технологий превратилось в рутинную часть нашей повседневной жизни. Скачок в качестве работы методов и программного обеспечения для речевых технологий обусловлен развитием методов машинного обучения, в частности нейронных сетей, ростом возможностей вычислительной техники, и в значительной мере сбором и широким использованием речевых и текстовых корпусов данных, которые обладают огромными, по меркам прошлого столетия, размерами. В докладе рассмотрены основные аспекты перечисленных выше двигателей развития речевых технологий в областях автоматического распознавания речи и фильтрации речевых сигналов. Упор сделан на существущих или ожидаемых практических решениях, связанных с использованием архитектур глубоких нейросетей (гибридных моделей (HMM-DNN) и сквозных (end-to-end) решений.

Язык: русский
Текст на другом сайте
Ключевые слова: автоматическое распознавание речиархитектура глубоких нейросетей

В книге

Труды 21-й Международной конференции «Цифровая обработка сигналов и ее применение – DSPA-2019»
Кн. 1. Вып. 21: Доклады 21-й Международной конференции. , Московское НТО радиотехники,электроники и связи им. А.С. Попова, 2019.
Похожие публикации
Распознавание речи в корпусе аудиозаписей торговых представителей: проблемы, решения и исследовательские перспективы
Колмогорова П. А., В кн.: Лингвистическая семантика в пространственном измерении: Словарь. Дискурс. Корпус.: Екатеринбург: Кабинетный ученый, 2024. Гл. 9.2 С. 411–422.
Добавлено: 29 ноября 2024 г.
Voice command recognition in intelligent systems using deep neural networks
Соколов А. С., Савченко А. В., , in: 17th World Symposium on Applied Machine Intelligence and Informatics (SAMI).: IEEE, 2019. Ch. 19 P. 113–116.
Добавлено: 21 октября 2019 г.
Нечеткое фонетическое кодирование речевых сигналов в системах обработки речевой информации
Савченко А. В., Савченко Л. В., Радиотехника и электроника 2019 Т. 64 № 3 С. 274–280
Исследован фонетический подход для систем обработки голосовой информации. Разработан метод автоматического распознавания речевых сигналов, в котором каждому квазистационарному сегменту ставится в соответствие нечеткое множество фонем. Предложено использовать операцию вероятностной треугольной нормы для нечетких множеств, соответствующих входному фрейму и ближайшей к нему эталонной фонемы. Экспериментально показано, что разработанный метод позволяет на 1.5…5% снизить вероятность ошибочного распознавания ...
Добавлено: 18 марта 2019 г.
Sequential Three-Way Decisions in Efficient Classification of Piecewise Stationary Speech Signals
Савченко А. В., , in: International Joint Conference on Rough Sets, Springer, Cham.: Springer, 2017. P. 264–277.
Добавлено: 26 октября 2018 г.
Information Theoretic Analysis of Efficiency of the Phonetic Encoding–Decoding Method in Automatic Speech Recognition
Савченко А. В., Savchenko V.V., Journal of Communications Technology and Electronics 2016 Vol. 61 No. 4 P. 430–435
Добавлено: 11 апреля 2016 г.
Теоретико-информационное обоснование и анализ эффективности метода фонетического кодирования-декодирования в задаче автоматического распознавания речи
Савченко А. В., Савченко В. В., Радиотехника и электроника 2016 Т. 61 № 4 С. 373–379
Рассмотрен метод фонетического кодирования–декодирования слов в задаче автоматического распознавания речи. На основе свойств информационного рассогласования Кульбака–Лейблера синтезирована оценка распределения рассогласования между минимальными речевыми единицами типа отдельных фонем внутри одного класса. Показано, что наименьшая дисперсия внутрифонемного рассогласования достигается при настройке фонетической базы данных на голос конкретного (одного) диктора. Полученные оценки подтверждены результатам экспериментальных исследований в задаче ...
Добавлено: 8 октября 2015 г.
Towards the creation of reliable voice control system based on a fuzzy approach
Савченко А. В., Savchenko Lyudmila V., Pattern Recognition Letters 2015 Vol. 65 P. 145–151
The key purpose of this paper is to train a voice control system if a small amount of user speech data is available without need for general acoustic model if the latter does not fit to the user voice due to known variability sources (childhood, voice diseases, non-nativeness, etc.). We explore the possibility to increase ...
Добавлено: 10 сентября 2015 г.
Гибридный детектор речи.
Вознесенская Т. В., Котов М. А., Леднов Д. А., Цифровая обработка сигналов 2014 № 4 С. 54–58
В данной статье описан детектор, работа которого основана, на таком устойчивом признаке речи, отличающем ее от всех прочих шумов, как наличие  вокализованных интервалов. ...
Добавлено: 20 ноября 2014 г.
Краткий обзор приложения метода условных случайных полей в области распознавания речи
Вознесенская Т. В., Леднов Д. А., Речевые технологии 2013 № 4 С. 127–134
Цель этой работы обзор математических основ модели условных случайных полей, а так же идеологическое сравнение этой модели с другими известными направлениями обработки речи. ...
Добавлено: 20 ноября 2014 г.
Semi-automated Speaker Adaptation: How to Control the Quality of Adaptation?
Савченко А. В., Lecture Notes in Computer Science 2014 Vol. 8509 P. 638–646
Добавлено: 25 июля 2014 г.
Оценка неопределенности словаря для метода фонетического декодирования в задаче распознавания изолированных слов
Савченко А. В., Вестник компьютерных и информационных технологий 2014 № 3 С. 30–37
Рассмотрен подход к решению задачи распознавания изолированных слов русской речи для систем голосового управления на основе метода фонетического декодирования. В рамках теоретико-информационного подхода предложено нахождение неопре­деленности рабочего словаря как величины условной энтропии канала с шумами, на вход которого поступает некоторое слово из словаря, а на выходе появляется распознаваемый речевой сигнал. На основе свойств информационного рассогласования Кульбака–Лейблера представлена ...
Добавлено: 26 марта 2014 г.
Сегментация речи на основе вероятностной нейронной сети с проверкой однородности
Савченко А. В., Информационные системы и технологии 2014 № 2 С. 12–18
Предложен новый критерий сегментации речи, основанный на идее вероятностной нейронной сети с проверкой однородности. Экспериментально продемонстрировано, что предложенный подход позволяет на 2-7% повысить точность распознавания гласных звуков в слоге по сравнению с традиционным критерием, основанным на сопоставлении с фиксированным порогом расстояния между очередным фреймом и предыдущим однородным участком ...
Добавлено: 26 марта 2014 г.
Сегментация речи в задачах автоматического обнаружения и распознавания голосовых команд
Савченко А. В., Информационные технологии 2014 № 1 С. 53–57
Рассмотрена задача автоматического выделения голосовых команд из непрерывного речевого потока и их последующего распознавания. Для обнаружения в слогах границ гласных звуков используется основанный на идее вероятностной нейронной сети с проверкой однородности алгоритм фонемной сегментации речи. Предложено считать речевой сигнал частью голосовой команды, если доля длительности выделенного в нем однородного сегмента по отношению к длительности всего ...
Добавлено: 20 января 2014 г.
О применении Фишеровских ядер в задаче рас-познавания диктора
Ермилов А. В., Известия Юго-Западного государственного университета 2011 № 2 С. 15–20
Исследуются методы применения машины опорных векторов (Support Vector Machine - SVM) с разными типами ядер к задаче идентификации диктора. В качестве входных данных используются Фишеровские признаки для разных типов каналов (телефон и GSM, микрофон). Анализируется точность идентификации при варьировании длительности сообщения. ...
Добавлено: 18 января 2014 г.
Алгоритм оценки параметров авторегрессионной модели элементарных речевых единиц
Губочкин И. В., Моделирование и анализ информационных систем 2013 Т. 20 № 2 С. 23–33
Рассмотрена задача оценки параметров авторегрессионной модели элементарных речевых единиц типа фонем. Предложен итерационный алгоритм поиска авторегрессионной модели фонемы, заданной множеством ее реализаций, в основе которого лежит метод Ньютона, предназначенный для численной минимизации функций. Для этого были получены аналитические выражения для градиента и гессиана величины информационного рассогласования Кульбака–Лейблера между моделями авторегрессии. В ходе экспериментальных исследований на ...
Добавлено: 2 декабря 2013 г.
Кластеризация авторегрессионных моделей речевых сигналов по критерию минимума информационного рассогласования Кульбака – Лейблера
Губочкин И. В., Карпов Н. В., Информационно-управляющие системы 2013 № 5(66) С. 34–42
Решается задача кластеризации множества авторегрессионных моделей речевых сигналов в рамках теоретико-информационного подхода. Для этого был разработан алгоритм нахождения оптимальных параметров авторегрессионной модели в смысле минимума информационного рассогласования Кульбака – Лейблера. На его основе проведена модификации известного алгоритма кластеризации k-средних. Экспериментально исследована эффективность применения разработанных алгоритмов при дикторонезависимом распознавании изолированных слов с использованием аппарата скрытых марковских ...
Добавлено: 2 декабря 2013 г.
Об одном подходе к разработке автоматизированной системы дистанционного обучения произношению слов на основе вероятностной нейронной сети с проверкой однородности
Савченко А. В., В кн.: Нелинейная динамика в когнитивных исследованиях-2013. Труды III Всероссийской конференции.: Н. Новгород: Институт прикладной физики РАН, 2013. С. 144–147.
В работе рассмотрены основные алгоритмы и их программная реализация на платформе Silverlight 4, которые могут применяться для переноса в режим дистанционного обучения систем обучения языку программ "Профессор Хиггинс" компании "ИстраСофт". ...
Добавлено: 21 сентября 2013 г.
Fuzzy Phonetic Decoding Method in a Phoneme Recognition Problem
Савченко А. В., Savchenko L. V., Lecture Notes in Artificial Intelligence 2013 Vol. 7911 P. 176–183
The definition of a phoneme as a fuzzy set of minimal speech units from the model database is proposed. On the basis of this definition and the Kullback-Leibler minimum information discrimination principle the novel phoneme recognition algorithm has been developed as an enhancement of the phonetic decoding method. The experimental results in the problems of ...
Добавлено: 16 июня 2013 г.
Методика формирования фонетической базы данных диктора из непрерывного потока разговорной речи на основе адаптивного алгоритма сегментации фонем и когнитивной кластерной модели речевых единиц
Савченко А. В., Акатьев Д. Ю., Информационные системы и технологии 2013 № 3 (77) С. 5–12
Рассмотрена проблема вариативности разговорной речи в задаче формирования фонетической базы данных. Для её решения предложено использование автоматической сегментации речи на последовательность фонем на основе когнитивной акустической модели типа фонетического кластера, определённого на множестве минимальных звуковых единиц. Разработан адаптивный алгоритм наполнения каждого кластера одноименными минимальными звуковыми единицами из непрерывного потока речи диктора. Представлены результаты экспериментального исследования ...
Добавлено: 7 мая 2013 г.
  • О ВЫШКЕ
  • Цифры и факты
  • Руководство и структура
  • Устойчивое развитие в НИУ ВШЭ
  • Преподаватели и сотрудники
  • Корпуса и общежития
  • Закупки
  • Обращения граждан в НИУ ВШЭ
  • Фонд целевого капитала
  • Противодействие коррупции
  • Сведения о доходах, расходах, об имуществе и обязательствах имущественного характера
  • Сведения об образовательной организации
  • Людям с ограниченными возможностями здоровья
  • Единая платежная страница
  • Работа в Вышке
  • ОБРАЗОВАНИЕ
  • Лицей
  • Довузовская подготовка
  • Олимпиады
  • Прием в бакалавриат
  • Вышка+
  • Прием в магистратуру
  • Аспирантура
  • Дополнительное образование
  • Центр развития карьеры
  • Бизнес-инкубатор ВШЭ
  • Образовательные партнерства
  • Обратная связь и взаимодействие с получателями услуг
  • НАУКА
  • Научные подразделения
  • Исследовательские проекты
  • Мониторинги
  • Диссертационные советы
  • Защиты диссертаций
  • Академическое развитие
  • Конкурсы и гранты
  • Внешние научно-информационные ресурсы
  • РЕСУРСЫ
  • Библиотека
  • Издательский дом ВШЭ
  • Книжный магазин «БукВышка»
  • Типография
  • Медиацентр
  • Журналы ВШЭ
  • Публикации
  • http://www.minobrnauki.gov.ru/
    Министерство науки и высшего образования РФ
  • https://edu.gov.ru/
    Министерство просвещения РФ
  • http://www.edu.ru
    Федеральный портал «Российское образование»
  • https://elearning.hse.ru/mooc
    Массовые открытые онлайн-курсы
  • НИУ ВШЭ1993–2026
  • Адреса и контакты
  • Условия использования материалов
  • Политика конфиденциальности
  • Правила применения рекомендательных технологий в НИУ ВШЭ
  • Карта сайта
Редактору