Impact of ASR performance on free speaking language assessment

Knill K.; Gales M.; Kyriakopoulos K.; Ragni A.; Wang Y.; Caines A.

doi:10.21437/Interspeech.2018-1312

Публикации

?

Impact of ASR performance on free speaking language assessment

P. 1641–1645.

Knill K., Gales M., Kyriakopoulos K., Малинин А. А., Ragni A., Wang Y., Caines A.

Язык: английский

DOI

Текст на другом сайте

Ключевые слова: speech recognition spoken language assessment

В книге

Interspeech 2018

International Speech Communication Association, 2018.

LowResourceEval2021: a shared task on speech processing for lowresource languages

Klyachko Elena, Grebenkin D., Nosenko D. и др., , in: Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной международной конференции «Диалог» (Москва, 16–19 июня 2021 г.)Issue 20.: Russian State University for the Humanitie, 2021.

Добавлено: 29 сентября 2021 г.

Распознавание изолированных слов на основе взвешенного голосования дикторозависимых нейросетевых моделей

Савченко Л. В., Информационные технологии 2020 Т. 26 № 5 С. 290–296

В статье рассматривается задача распознавания изолированных слов с помощью методов глубокого обучения и сверточных нейронных сетей. Предложено выполнить дообучение сетей для проведения адаптации акустических моделей на голос диктора с использованием малого числа произнесенных им реализаций эталонных слов. Для понижения вероятности ошибочного распознавания рассматривается комбинирование нескольких различных дообученных дикторозависимых нейросетевых моделей. ...

Добавлено: 2 сентября 2020 г.

Система постановки произношения на основе сверточных нейронных сетей и информационной теории восприятия речи

Савченко Л. В., Информационные технологии 2019 Т. 25 № 5 С. 313–318

Рассматривается задача постановки произношения на основе применения методов глубокого обучения совместно с информационной теорией восприятия речи. Для повышения эффективности тестирования качества произношения предложено проводить дообучение сверточной нейронной сети с использованием наилучших эталонов пользователя. Экспериментально показано, что предложенный подход характеризуется высокой точность и скоростью распознавания для различных акустических моделей по сравнению с известными аналогами. ...

Добавлено: 29 мая 2019 г.

Sequential Three-Way Decisions in Efficient Classification of Piecewise Stationary Speech Signals

Савченко А. В., , in: International Joint Conference on Rough Sets, Springer, Cham.: Springer, 2017. P. 264–277.

Добавлено: 26 октября 2018 г.

Pattern Recognition and Machine Intelligence. 7th International Conference, PReMI 2017, Kolkata, India, December 5-8, 2017, Proceedings. Lecture Notes in Computer Science book series (LNCS, volume 10597)

Springer, 2017.

Добавлено: 14 октября 2018 г.

Emotion Recognition in Sound

Попова А. С., Alexandr G. Rassadin, Alexander A. Ponomarenko, , in: Advances in Neural Computation, Machine Learning, and Cognitive Research. Selected Papers from the XIX International Conference on Neuroinformatics, October 2-6, 2017, Moscow, RussiaVol. 736.: Cham: Springer, 2017. P. 117–124.

Добавлено: 18 октября 2017 г.

Детектирование эмоций в мультимедиа контенте

А. С. Попова, А. Г. Рассадин, А. А. Пономаренко, В кн.: Материалы XXIII международной научно-технической конференции «Информационные системы и технологии-2017».: [б.и.], 2017. С. 852–857.

Рассматривается задача автоматической классификации эмоций в цифровом аудио сигнале. В работе рассматривается и верифицируется подход, в котором классификации звукового фрагмента сводится к задаче распознавания изображений. В качестве визуально представления использовались изображение спектрограммы и осциллограммы. Произведен численный эксперимент на открытом наборе данных Ravdess, включающий 8 различных эмоций: “нейтральный”, “спокойный”, “счастливый”, “грустный”, “злой”, “испуганный”, “отвращение”, “удивление”. Наилучшие ...

Добавлено: 18 октября 2017 г.

Разработка универсальной роботизированной платформы

Романов А. Ю., Американов А. А., Лежнев Е. В. и др., Прикладная радиоэлектроника 2016 Т. 15 № 2 С. 123–126

Представлено описание разработки роботизированной платформы для помещений. Универсальность платформы дает возможность ее применения в различных областях человеческой жизнедеятельности, как при дистанционном управлении, так и в автономном режиме. Описаны этапы создания роботизированной платформы, приведены ее характеристики и представлены результаты ее работы. ...

Добавлено: 7 октября 2016 г.

Information Theoretic Analysis of Efficiency of the Phonetic Encoding–Decoding Method in Automatic Speech Recognition

Савченко А. В., Savchenko V.V., Journal of Communications Technology and Electronics 2016 Vol. 61 No. 4 P. 430–435

Добавлено: 11 апреля 2016 г.

Теоретико-информационное обоснование и анализ эффективности метода фонетического кодирования-декодирования в задаче автоматического распознавания речи

Савченко А. В., Савченко В. В., Радиотехника и электроника 2016 Т. 61 № 4 С. 373–379

Рассмотрен метод фонетического кодирования–декодирования слов в задаче автоматического распознавания речи. На основе свойств информационного рассогласования Кульбака–Лейблера синтезирована оценка распределения рассогласования между минимальными речевыми единицами типа отдельных фонем внутри одного класса. Показано, что наименьшая дисперсия внутрифонемного рассогласования достигается при настройке фонетической базы данных на голос конкретного (одного) диктора. Полученные оценки подтверждены результатам экспериментальных исследований в задаче ...

Добавлено: 8 октября 2015 г.

Towards the creation of reliable voice control system based on a fuzzy approach

Савченко А. В., Savchenko Lyudmila V., Pattern Recognition Letters 2015 Vol. 65 P. 145–151

The key purpose of this paper is to train a voice control system if a small amount of user speech data is available without need for general acoustic model if the latter does not fit to the user voice due to known variability sources (childhood, voice diseases, non-nativeness, etc.). We explore the possibility to increase ...

Добавлено: 10 сентября 2015 г.

Classification of a Sequence of Objects with the Fuzzy Decoding Method

Савченко А. В., Savchenko L. V., Lecture Notes in Artificial Intelligence 2014 Vol. 8536 P. 309–318

Добавлено: 25 июля 2014 г.

Semi-automated Speaker Adaptation: How to Control the Quality of Adaptation?

Савченко А. В., Lecture Notes in Computer Science 2014 Vol. 8509 P. 638–646

Добавлено: 25 июля 2014 г.

Phonetic encoding method in the isolated words recognition problem

Савченко А. В., Journal of Communications Technology and Electronics 2014 Vol. 59 No. 4 P. 339–345

A phonetic approach to the problem of automatic recognition of isolated words is investigated.The phonetic encoding method whereby each word from a vocabulary is associated with the code sequenceof stable phonemes is proposed. The informationtheoretical estimate of vocabulary confusability, the calcuations of which rely on the phonetic database of a speaker and the communications channel ...

Добавлено: 8 апреля 2014 г.

Применении Фишеровских ядер к задаче идентификации диктора

Гостев И. М., Ермилов А. В., Известия Юго-Западного государственного университета 2011 № 2 С. 15–22

Исследуются методы применения машины опорных векторов (Support Vector Machine -SVM) с разными типами ядер к задаче идентификации диктора. В качестве входных данных используются Фишеровские признаки для разных типов каналов (телефон и GSM, микрофон). Анализируется точность идентификации при варьировании длительности сообщения. ...

Добавлено: 31 января 2014 г.

Об одном подходе к разработке автоматизированной системы дистанционного обучения произношению слов на основе вероятностной нейронной сети с проверкой однородности

Савченко А. В., В кн.: Нелинейная динамика в когнитивных исследованиях-2013. Труды III Всероссийской конференции.: Н. Новгород: Институт прикладной физики РАН, 2013. С. 144–147.

В работе рассмотрены основные алгоритмы и их программная реализация на платформе Silverlight 4, которые могут применяться для переноса в режим дистанционного обучения систем обучения языку программ "Профессор Хиггинс" компании "ИстраСофт". ...

Добавлено: 21 сентября 2013 г.

Phonetic Words Decoding Software in the Problem of Russian Speech Recognition

Савченко А. В., Automation and Remote Control 2013 Vol. 74 No. 7 P. 1225–1232

The prototype of the isolated words recognition software based on the phonetic decoding method with the Kullback-Leibler divergence is presented. The architecture and basic algorithms of the software are described. Finally, an example of application to the problem of isolated words recognition is provided. ...

Добавлено: 1 августа 2013 г.

Fuzzy Phonetic Decoding Method in a Phoneme Recognition Problem

Савченко А. В., Savchenko L. V., Lecture Notes in Artificial Intelligence 2013 Vol. 7911 P. 176–183

The definition of a phoneme as a fuzzy set of minimal speech units from the model database is proposed. On the basis of this definition and the Kullback-Leibler minimum information discrimination principle the novel phoneme recognition algorithm has been developed as an enhancement of the phonetic decoding method. The experimental results in the problems of ...

Добавлено: 16 июня 2013 г.

Алгоритм работы программной реализации фильтра Виннера

Кузнецов Д. С., Естественные и технические науки 2009 № 4 С. 365–369

В данной статье рассматривается фильтр Винера в качестве метода повышения эффективности работы систем распознавания речи. Приводятся сведения о возможных модификациях фильтра Винера для повышения степени шумоподавления. Рассматривается алгоритм работы программной реализации классического фильтра Винера и его модификаций. ...

Добавлено: 21 февраля 2013 г.