?
Information Theoretic Analysis of Efficiency of the Phonetic Encoding–Decoding Method in Automatic Speech Recognition
Journal of Communications Technology and Electronics. 2016. Vol. 61. No. 4. P. 430-435.
Савченко А. В., Savchenko V.V.
Научное направление:
Компьютерные науки
Приоритетные направления:
компьютерно-математическое
Язык:
английский
Савченко А. В., Савченко В. В., Радиотехника и электроника 2016 Т. 61 № 4 С. 373-379
Рассмотрен метод фонетического кодирования–декодирования слов в задаче автоматического распознавания речи. На основе свойств информационного рассогласования Кульбака–Лейблера синтезирована оценка распределения рассогласования между минимальными речевыми единицами типа отдельных фонем внутри одного класса. Показано, что наименьшая дисперсия внутрифонемного рассогласования достигается при настройке фонетической базы данных на голос конкретного (одного) диктора. Полученные оценки подтверждены результатам экспериментальных исследований в задаче ...
Добавлено: 8 октября 2015 г.
Савченко А. В., Savchenko L. V., Lecture Notes in Artificial Intelligence 2013 Vol. 7911 P. 176-183
The definition of a phoneme as a fuzzy set of minimal speech units from the model database is proposed. On the basis of this definition and the Kullback-Leibler minimum information discrimination principle the novel phoneme recognition algorithm has been developed as an enhancement of the phonetic decoding method. The experimental results in the problems of ...
Добавлено: 16 июня 2013 г.
Савченко А. В., Journal of Communications Technology and Electronics 2014 Vol. 59 No. 4 P. 339-345
A phonetic approach to the problem of automatic recognition of isolated words is investigated.The phonetic encoding method whereby each word from a vocabulary is associated with the code sequenceof stable phonemes is proposed. The informationtheoretical estimate of vocabulary confusability, the calcuations of which rely on the phonetic database of a speaker and the communications channel ...
Добавлено: 8 апреля 2014 г.
Савченко А. В., Savchenko Lyudmila V., Pattern Recognition Letters 2015 Vol. 65 P. 145-151
The key purpose of this paper is to train a voice control system if a small amount of user speech data is available without need for general acoustic model if the latter does not fit to the user voice due to known variability sources (childhood, voice diseases, non-nativeness, etc.). We explore the possibility to increase ...
Добавлено: 10 сентября 2015 г.
Савченко А. В., Вестник компьютерных и информационных технологий 2014 № 3 С. 30-37
Рассмотрен подход к решению задачи распознавания изолированных слов русской речи для систем голосового управления
на основе метода фонетического декодирования. В рамках теоретико-информационного подхода предложено нахождение неопределенности рабочего словаря как величины условной энтропии канала с шумами, на вход которого поступает некоторое слово
из словаря, а на выходе появляется распознаваемый речевой сигнал. На основе свойств информационного рассогласования Кульбака–Лейблера представлена ...
Добавлено: 26 марта 2014 г.
Савченко А. В., Lecture Notes in Computer Science 2014 Vol. 8509 P. 638-646
Добавлено: 25 июля 2014 г.
Савченко А. В., Automation and Remote Control 2013 Vol. 74 No. 7 P. 1225-1232
The prototype of the isolated words recognition software based on the phonetic decoding method with the Kullback-Leibler divergence is presented. The architecture and basic algorithms of the software are described. Finally, an example of application to the problem of isolated words recognition is provided. ...
Добавлено: 1 августа 2013 г.
Савченко А. В., Lecture Notes in Artificial Intelligence 2017 Vol. 10314 P. 264-277
Добавлено: 27 июня 2017 г.
Савченко А. В., Информационные технологии 2013 № 4 С. 34-39
Ставится и решается задача автоматического распознавания речи для системы голосового управления. Предложен адаптивный алгоритм распознавания, на первом этапе которого для всех выделенных слогов распознаются гласные фонемы, а на втором происходит уточнение произнесенных слогов. Показано, что такой подход приводит к созданию высоконадежной обучаемой системы, в которой продолжительность настройки под диктора на порядок ниже аналогичного показателя для ...
Добавлено: 13 апреля 2013 г.
Савченко А. В., Информационные технологии 2014 № 1 С. 53-57
Рассмотрена задача автоматического выделения голосовых команд из непрерывного речевого потока и их последующего распознавания. Для обнаружения в слогах границ гласных звуков используется основанный на идее вероятностной нейронной сети с проверкой однородности алгоритм фонемной сегментации речи. Предложено считать речевой сигнал частью голосовой команды, если доля длительности выделенного в нем однородного сегмента по отношению к длительности всего ...
Добавлено: 20 января 2014 г.
Савченко А. В., Savchenko L. V., Lecture Notes in Artificial Intelligence 2014 Vol. 8536 P. 309-318
Добавлено: 25 июля 2014 г.
Савченко А. В., Khokhlova Y. I., Optical Memory and Neural Networks (Information Optics) 2014 Vol. 23 No. 1 P. 34-42
Добавлено: 26 марта 2014 г.
Губочкин И. В., Моделирование и анализ информационных систем 2013 Т. 20 № 2 С. 23-33
Рассмотрена задача оценки параметров авторегрессионной модели элементарных речевых единиц типа фонем. Предложен итерационный алгоритм поиска авторегрессионной модели фонемы, заданной множеством ее реализаций, в основе которого лежит метод Ньютона, предназначенный для численной минимизации функций. Для этого были получены аналитические выражения для градиента и гессиана величины информационного рассогласования Кульбака–Лейблера между моделями авторегрессии. В ходе экспериментальных исследований на ...
Добавлено: 2 декабря 2013 г.
Савченко А. В., Савченко Л. В., Вестник компьютерных и информационных технологий 2013 № 3 С. 36-41
В рамках информационной теории восприятия речи предложено определение фонемы как нечеткого множества минимальных речевых единиц. На основе данного определения и принципа минимума информационного рассогласования в развитие известного метода фонетического декодирования слов синтезирован новый алгоритм распознавания фонем. Представлены результаты его экспериментального исследования для распознавания гласных звуков русского языка. ...
Добавлено: 27 апреля 2013 г.
Савченко А. В., Системы управления и информационные технологии 2013 № 1(51) С. 71-75
Рассматривается экспериментальный образец программного комплекса распознавания изолированных слов на основе метода фонетического декодирования в информационной метрике Кульбака-Лейблера. Дается обзор его архитектуры и основных алгоритмов. Представлен пример практического применения в задаче распознавания изолированных слов ...
Добавлено: 2 апреля 2013 г.
Switzerland : Springer, 2017
Добавлено: 11 марта 2018 г.
В данной статье описан детектор, работа которого основана, на таком устойчивом признаке речи, отличающем ее от всех прочих шумов, как наличие вокализованных интервалов. ...
Добавлено: 20 ноября 2014 г.
Berlin, Heidelberg : Springer, 2012
Добавлено: 21 сентября 2012 г.
IEEE, 2019
Добавлено: 27 октября 2019 г.
М. : Наука, 2010
Монография посвящена анализу современного состояния нейронаук с учетом последних мировых достижений, вклада российских исследователей в эту область знаний и перспектив развития. Сформулированы основные принципы функционирования нервной системы и мозга у человека и животных на всех уровнях - от молекулярно-клеточного до организменного. Освещены современные представления о механизмах развития нервных и психических заболеваний, а также приведены новые ...
Добавлено: 20 мая 2013 г.
Кузнецов Д. С., Естественные и технические науки 2009 № 4 С. 365-369
В данной статье рассматривается фильтр Винера в качестве метода повышения эффективности работы систем распознавания речи. Приводятся сведения о возможных модификациях фильтра Винера для повышения степени шумоподавления. Рассматривается алгоритм работы программной реализации классического фильтра Винера и его модификаций. ...
Добавлено: 21 февраля 2013 г.
Maxim Borisyak, Zykov R., Noskov A., / Cornell University. Series arxiv :: cs :: Cornell University "arxiv :: cs :: Cornell University". 2015.
Добавлено: 9 ноября 2015 г.
Савченко Л. В., Информационные технологии 2019 Т. 25 № 5 С. 313-318
Рассматривается задача постановки произношения на основе применения методов глубокого обучения совместно с информационной теорией восприятия речи. Для повышения эффективности тестирования качества произношения предложено проводить дообучение сверточной нейронной сети с использованием наилучших эталонов пользователя. Экспериментально показано, что предложенный подход характеризуется высокой точность и скоростью распознавания для различных акустических моделей по сравнению с известными аналогами. ...
Добавлено: 29 мая 2019 г.
В работе обсуждаются современные подходы к проектированию сложных интеллектуальных систем компьютерного контроля знаний иностранного языка, использующихся, в частности, для поддержки учебного процесса в высшем учебном заведении. Исследуются механизмы построения онтологических моделей ситуаций в задачах компьютерного контроля знаний английского языка в рамках парадигмы ограниченной рациональности.
На примере личных местоимений проиллюстрированы характерные особенности поведения холонов, взявших на себя ...
Добавлено: 24 октября 2012 г.