?
Semi-automated Speaker Adaptation: How to Control the Quality of Adaptation?
Lecture Notes in Computer Science. 2014. Vol. 8509. P. 638-646.
Научное направление:
Компьютерные науки
Приоритетные направления:
компьютерно-математическое
Язык:
английский
Ключевые слова: автоматическое распознавание речиspeech recognitionавторегрессиясистемы голосового управленияvoice control systemspeaker adaptationautoregressionадаптация на голос диктора
ПУБЛИКАЦИЯ ПОДГОТОВЛЕНА ПО РЕЗУЛЬТАТАМ ПРОЕКТА:
Савченко А. В., Savchenko Lyudmila V., Pattern Recognition Letters 2015 Vol. 65 P. 145-151
The key purpose of this paper is to train a voice control system if a small amount of user speech data is available without need for general acoustic model if the latter does not fit to the user voice due to known variability sources (childhood, voice diseases, non-nativeness, etc.). We explore the possibility to increase ...
Добавлено: 10 сентября 2015 г.
Савченко А. В., Journal of Communications Technology and Electronics 2014 Vol. 59 No. 4 P. 339-345
A phonetic approach to the problem of automatic recognition of isolated words is investigated.The phonetic encoding method whereby each word from a vocabulary is associated with the code sequenceof stable phonemes is proposed. The informationtheoretical estimate of vocabulary confusability, the calcuations of which rely on the phonetic database of a speaker and the communications channel ...
Добавлено: 8 апреля 2014 г.
Крючков М. В., Русаков С. В., Вестник Ижевского государственного технического университета 2015 № 2(66) С. 110-112
В работе описаны результаты тестирования нейросетевого технического индикатора тренда по данным биржевого курса нефти марки Brent в 2014 году. Апробация модели проводилась на трех временных интервалах, характеризующихся своими особенностями. ...
Добавлено: 31 августа 2015 г.
Савченко А. В., Информационные технологии 2013 № 4 С. 34-39
Ставится и решается задача автоматического распознавания речи для системы голосового управления. Предложен адаптивный алгоритм распознавания, на первом этапе которого для всех выделенных слогов распознаются гласные фонемы, а на втором происходит уточнение произнесенных слогов. Показано, что такой подход приводит к созданию высоконадежной обучаемой системы, в которой продолжительность настройки под диктора на порядок ниже аналогичного показателя для ...
Добавлено: 13 апреля 2013 г.
Савченко А. В., Информационные технологии 2014 № 1 С. 53-57
Рассмотрена задача автоматического выделения голосовых команд из непрерывного речевого потока и их последующего распознавания. Для обнаружения в слогах границ гласных звуков используется основанный на идее вероятностной нейронной сети с проверкой однородности алгоритм фонемной сегментации речи. Предложено считать речевой сигнал частью голосовой команды, если доля длительности выделенного в нем однородного сегмента по отношению к длительности всего ...
Добавлено: 20 января 2014 г.
Савченко А. В., Савченко В. В., Радиотехника и электроника 2016 Т. 61 № 4 С. 373-379
Рассмотрен метод фонетического кодирования–декодирования слов в задаче автоматического распознавания речи. На основе свойств информационного рассогласования Кульбака–Лейблера синтезирована оценка распределения рассогласования между минимальными речевыми единицами типа отдельных фонем внутри одного класса. Показано, что наименьшая дисперсия внутрифонемного рассогласования достигается при настройке фонетической базы данных на голос конкретного (одного) диктора. Полученные оценки подтверждены результатам экспериментальных исследований в задаче ...
Добавлено: 8 октября 2015 г.
Савченко А. В., Savchenko L. V., Lecture Notes in Artificial Intelligence 2013 Vol. 7911 P. 176-183
The definition of a phoneme as a fuzzy set of minimal speech units from the model database is proposed. On the basis of this definition and the Kullback-Leibler minimum information discrimination principle the novel phoneme recognition algorithm has been developed as an enhancement of the phonetic decoding method. The experimental results in the problems of ...
Добавлено: 16 июня 2013 г.
Савченко А. В., Lecture Notes in Artificial Intelligence 2017 Vol. 10314 P. 264-277
Добавлено: 27 июня 2017 г.
Савченко А. В., Savchenko V.V., Journal of Communications Technology and Electronics 2016 Vol. 61 No. 4 P. 430-435
Добавлено: 11 апреля 2016 г.
Савченко А. В., Информационные системы и технологии 2014 № 2 С. 12-18
Предложен новый критерий сегментации речи, основанный на идее вероятностной нейронной сети с проверкой однородности. Экспериментально продемонстрировано, что предложенный подход позволяет на 2-7% повысить точность распознавания гласных звуков в слоге по сравнению с традиционным критерием, основанным на сопоставлении с фиксированным порогом расстояния между очередным фреймом и предыдущим однородным участком ...
Добавлено: 26 марта 2014 г.
Губочкин И. В., Моделирование и анализ информационных систем 2013 Т. 20 № 2 С. 23-33
Рассмотрена задача оценки параметров авторегрессионной модели элементарных речевых единиц типа фонем. Предложен итерационный алгоритм поиска авторегрессионной модели фонемы, заданной множеством ее реализаций, в основе которого лежит метод Ньютона, предназначенный для численной минимизации функций. Для этого были получены аналитические выражения для градиента и гессиана величины информационного рассогласования Кульбака–Лейблера между моделями авторегрессии. В ходе экспериментальных исследований на ...
Добавлено: 2 декабря 2013 г.
Савченко А. В., Савченко Л. В., Вестник компьютерных и информационных технологий 2013 № 3 С. 36-41
В рамках информационной теории восприятия речи предложено определение фонемы как нечеткого множества минимальных речевых единиц. На основе данного определения и принципа минимума информационного рассогласования в развитие известного метода фонетического декодирования слов синтезирован новый алгоритм распознавания фонем. Представлены результаты его экспериментального исследования для распознавания гласных звуков русского языка. ...
Добавлено: 27 апреля 2013 г.
Соколов А. С., Савченко А. В., , in : 17th World Symposium on Applied Machine Intelligence and Informatics (SAMI). : IEEE, 2019. Ch. 19. P. 113-116.
Добавлено: 21 октября 2019 г.
Савченко А. В., Savchenko L. V., Lecture Notes in Artificial Intelligence 2014 Vol. 8536 P. 309-318
Добавлено: 25 июля 2014 г.
Губочкин И. В., Карпов Н. В., Информационно-управляющие системы 2013 № 5(66) С. 34-42
Решается задача кластеризации множества авторегрессионных моделей речевых сигналов в рамках теоретико-информационного подхода. Для этого был разработан алгоритм нахождения оптимальных параметров авторегрессионной модели в смысле минимума информационного рассогласования Кульбака – Лейблера. На его основе проведена модификации известного алгоритма кластеризации k-средних. Экспериментально исследована эффективность применения разработанных алгоритмов при дикторонезависимом распознавании изолированных слов с использованием аппарата скрытых марковских ...
Добавлено: 2 декабря 2013 г.
В данной статье описан детектор, работа которого основана, на таком устойчивом признаке речи, отличающем ее от всех прочих шумов, как наличие вокализованных интервалов. ...
Добавлено: 20 ноября 2014 г.
Berlin, Heidelberg : Springer, 2012
Добавлено: 21 сентября 2012 г.
Савченко А. В., Вестник компьютерных и информационных технологий 2014 № 3 С. 30-37
Рассмотрен подход к решению задачи распознавания изолированных слов русской речи для систем голосового управления
на основе метода фонетического декодирования. В рамках теоретико-информационного подхода предложено нахождение неопределенности рабочего словаря как величины условной энтропии канала с шумами, на вход которого поступает некоторое слово
из словаря, а на выходе появляется распознаваемый речевой сигнал. На основе свойств информационного рассогласования Кульбака–Лейблера представлена ...
Добавлено: 26 марта 2014 г.
Кузнецов Д. С., Естественные и технические науки 2009 № 4 С. 365-369
В данной статье рассматривается фильтр Винера в качестве метода повышения эффективности работы систем распознавания речи. Приводятся сведения о возможных модификациях фильтра Винера для повышения степени шумоподавления. Рассматривается алгоритм работы программной реализации классического фильтра Винера и его модификаций. ...
Добавлено: 21 февраля 2013 г.
В работе обсуждаются современные подходы к проектированию сложных интеллектуальных систем компьютерного контроля знаний иностранного языка, использующихся, в частности, для поддержки учебного процесса в высшем учебном заведении. Исследуются механизмы построения онтологических моделей ситуаций в задачах компьютерного контроля знаний английского языка в рамках парадигмы ограниченной рациональности.
На примере личных местоимений проиллюстрированы характерные особенности поведения холонов, взявших на себя ...
Добавлено: 24 октября 2012 г.
Савченко А. В., Automation and Remote Control 2013 Vol. 74 No. 7 P. 1225-1232
The prototype of the isolated words recognition software based on the phonetic decoding method with the Kullback-Leibler divergence is presented. The architecture and basic algorithms of the software are described. Finally, an example of application to the problem of isolated words recognition is provided. ...
Добавлено: 1 августа 2013 г.
М. : Горная книга, 2017
Разработаны модель управления предприятием и последующая реализация программного обеспечения, позволяющего смоделировать варианты развития предприятия в долгосрочном периоде, комплекс программ на MATLAB, реализующих метод авторегрессии, спектрального и корреляционного анализа, программа на языке программирования Python для оценки платежеспособности заемщиков банка на основе модели с использованием нейронных сетей, исследованы характеристики стохастического временного ряда, предложены программы реализации алгоритмов масштабирования ...
Добавлено: 21 августа 2017 г.
Савченко Л. В., Информационные технологии 2019 Т. 25 № 5 С. 313-318
Рассматривается задача постановки произношения на основе применения методов глубокого обучения совместно с информационной теорией восприятия речи. Для повышения эффективности тестирования качества произношения предложено проводить дообучение сверточной нейронной сети с использованием наилучших эталонов пользователя. Экспериментально показано, что предложенный подход характеризуется высокой точность и скоростью распознавания для различных акустических моделей по сравнению с известными аналогами. ...
Добавлено: 29 мая 2019 г.
Ермилов А. В., Известия Юго-Западного государственного университета 2011 № 2 С. 15-20
Исследуются методы применения машины опорных векторов (Support Vector Machine - SVM) с разными типами ядер к задаче идентификации диктора. В качестве входных данных используются Фишеровские признаки для разных типов каналов (телефон и GSM, микрофон). Анализируется точность идентификации при варьировании длительности сообщения. ...
Добавлено: 18 января 2014 г.