?
Information Theoretic Analysis of Efficiency of the Phonetic Encoding–Decoding Method in Automatic Speech Recognition
Journal of Communications Technology and Electronics. 2016. Vol. 61. No. 4. P. 430-435.
Savchenko A., Savchenko V.V.
A words phonetic decoding method in automatic speech recognition is considered. The properties of Kullback–Leibler divergence are used to synthesize the estimation of the distribution of divergence between minimum speech units (e.g., single phonemes) inside a single class. It is demonstrated that the min imum variance of the intraphonemic divergence is reached when the phonetic database is tuned to the voice of a single speaker. The estimations are proven by experimental results on the recognition of vowel sounds and isolated words of Russian language.
Savchenko A., Савченко В. В., Радиотехника и электроника 2016 Т. 61 № 4 С. 373-379
Рассмотрен метод фонетического кодирования–декодирования слов в задаче автоматического распознавания речи. На основе свойств информационного рассогласования Кульбака–Лейблера синтезирована оценка распределения рассогласования между минимальными речевыми единицами типа отдельных фонем внутри одного класса. Показано, что наименьшая дисперсия внутрифонемного рассогласования достигается при настройке фонетической базы данных на голос конкретного (одного) диктора. Полученные оценки подтверждены результатам экспериментальных исследований в задаче ...
Added: October 8, 2015
Savchenko A., Savchenko L. V., Lecture Notes in Artificial Intelligence 2013 Vol. 7911 P. 176-183
The definition of a phoneme as a fuzzy set of minimal speech units from the model database is proposed. On the basis of this definition and the Kullback-Leibler minimum information discrimination principle the novel phoneme recognition algorithm has been developed as an enhancement of the phonetic decoding method. The experimental results in the problems of ...
Added: June 16, 2013
Savchenko A., Journal of Communications Technology and Electronics 2014 Vol. 59 No. 4 P. 339-345
A phonetic approach to the problem of automatic recognition of isolated words is investigated.The phonetic encoding method whereby each word from a vocabulary is associated with the code sequenceof stable phonemes is proposed. The informationtheoretical estimate of vocabulary confusability, the calcuations of which rely on the phonetic database of a speaker and the communications channel ...
Added: April 8, 2014
Savchenko A., Savchenko Lyudmila V., Pattern Recognition Letters 2015 Vol. 65 P. 145-151
The key purpose of this paper is to train a voice control system if a small amount of user speech data is available without need for general acoustic model if the latter does not fit to the user voice due to known variability sources (childhood, voice diseases, non-nativeness, etc.). We explore the possibility to increase ...
Added: September 10, 2015
Savchenko A., Вестник компьютерных и информационных технологий 2014 № 3 С. 30-37
Рассмотрен подход к решению задачи распознавания изолированных слов русской речи для систем голосового управления
на основе метода фонетического декодирования. В рамках теоретико-информационного подхода предложено нахождение неопределенности рабочего словаря как величины условной энтропии канала с шумами, на вход которого поступает некоторое слово
из словаря, а на выходе появляется распознаваемый речевой сигнал. На основе свойств информационного рассогласования Кульбака–Лейблера представлена ...
Added: March 26, 2014
Savchenko A., Lecture Notes in Computer Science 2014 Vol. 8509 P. 638-646
Since the early 1990s, speaker adaptation have become one of the intensive areas in speech recognition. State-of-the-art batch-mode adaptation algorithms assume that speech of particular speaker contains enough information about the user's voice. In this article we propose to allow the user to manually verify if the adaptation is useful. Our procedure requires the speaker ...
Added: July 25, 2014
Savchenko A., Automation and Remote Control 2013 Vol. 74 No. 7 P. 1225-1232
The prototype of the isolated words recognition software based on the phonetic decoding method with the Kullback-Leibler divergence is presented. The architecture and basic algorithms of the software are described. Finally, an example of application to the problem of isolated words recognition is provided. ...
Added: August 1, 2013
Savchenko A., Lecture Notes in Artificial Intelligence 2017 Vol. 10314 P. 264-277
In this paper it is proposed to improve performance of the automatic speech recognition by using sequential three-way decisions. At first, the largest piecewise quasi-stationary segments are detected in the speech signal. Every segment is classified using the maximum a-posteriori (MAP) method implemented with the Kullback-Leibler minimum information discrimination principle. The three-way decisions are taken ...
Added: June 27, 2017
Savchenko A., Информационные технологии 2013 № 4 С. 34-39
Ставится и решается задача автоматического распознавания речи для системы голосового управления. Предложен адаптивный алгоритм распознавания, на первом этапе которого для всех выделенных слогов распознаются гласные фонемы, а на втором происходит уточнение произнесенных слогов. Показано, что такой подход приводит к созданию высоконадежной обучаемой системы, в которой продолжительность настройки под диктора на порядок ниже аналогичного показателя для ...
Added: April 13, 2013
Savchenko A., Информационные технологии 2014 № 1 С. 53-57
Рассмотрена задача автоматического выделения голосовых команд из непрерывного речевого потока и их последующего распознавания. Для обнаружения в слогах границ гласных звуков используется основанный на идее вероятностной нейронной сети с проверкой однородности алгоритм фонемной сегментации речи. Предложено считать речевой сигнал частью голосовой команды, если доля длительности выделенного в нем однородного сегмента по отношению к длительности всего ...
Added: January 20, 2014
Savchenko A., Savchenko L. V., Lecture Notes in Artificial Intelligence 2014 Vol. 8536 P. 309-318
The problem of recognition of a sequence of objects (e.g., video-based image recognition, phoneme recognition) is explored. The generalization of the fuzzy phonetic decoding method is proposed by assuming the distribution of the classified object to be of exponential type. Its preliminary phase includes association of each model object with the fuzzy set of model ...
Added: July 25, 2014
Savchenko A., Khokhlova Y. I., Optical Memory and Neural Networks (Information Optics) 2014 Vol. 23 No. 1 P. 34-42
The paper considers the phoneme recognition by facial expressions of a speaker in voice-activated control systems. We have developed a neural network recognition algorithm by using the phonetic words decoding method and the requirement for isolated syllable pronunciation of voice commands. The paper presents the experimental results of viseme (facial and lip position corresponding to ...
Added: March 26, 2014
Gubochkin I., Моделирование и анализ информационных систем 2013 Т. 20 № 2 С. 23-33
The article considers the problem of estimating autoregressive model parameters of elementary speech units such as phonemes. It is suggested an iterative algorithm based on the Newton numerical minimization technique to search an autoregressive model of phonemes specified its multiple samples. For this purpose the analytical expressions of the gradient and the Hessian of Kullback–Leibler ...
Added: December 2, 2013
Savchenko A., Савченко Л. В., Вестник компьютерных и информационных технологий 2013 № 3 С. 36-41
В рамках информационной теории восприятия речи предложено определение фонемы как нечеткого множества минимальных речевых единиц. На основе данного определения и принципа минимума информационного рассогласования в развитие известного метода фонетического декодирования слов синтезирован новый алгоритм распознавания фонем. Представлены результаты его экспериментального исследования для распознавания гласных звуков русского языка. ...
Added: April 27, 2013
Savchenko A., Системы управления и информационные технологии 2013 № 1(51) С. 71-75
Рассматривается экспериментальный образец программного комплекса распознавания изолированных слов на основе метода фонетического декодирования в информационной метрике Кульбака-Лейблера. Дается обзор его архитектуры и основных алгоритмов. Представлен пример практического применения в задаче распознавания изолированных слов ...
Added: April 2, 2013
Switzerland : Springer, 2017
This book constitutes the refereed proceedings of the 5th International Castle Meeting on Coding Theory and Applications, ICMCTA 2017, held in Vihula, Estonia, in August 2017.
The 24 full papers presented were carefully reviewed and selected for inclusion in this volume. The papers cover relevant research areas in modern coding theory, including codes and combinatorial structures, ...
Added: March 11, 2018
Voznesenskaya T., Котов М. А., Леднов Д. А., Цифровая обработка сигналов 2014 № 4 С. 54-58
В данной статье описан детектор, работа которого основана, на таком устойчивом признаке речи, отличающем ее от всех прочих шумов, как наличие вокализованных интервалов. ...
Added: November 20, 2014
Berlin, Heidelberg : Springer, 2012
Added: September 21, 2012
IEEE, 2019
XVI International Symposium "Problems of Redundancy in Information and Control Systems" is the conference that covers a wide area of aspects of information and communication systems. The main goal of the Symposium foundation is the reinforcement of cooperation between the representatives of various scientific schools, a possibility for the participants to get awareness of the ...
Added: October 27, 2019
М. : Наука, 2010
Монография посвящена анализу современного состояния нейронаук с учетом последних мировых достижений, вклада российских исследователей в эту область знаний и перспектив развития. Сформулированы основные принципы функционирования нервной системы и мозга у человека и животных на всех уровнях - от молекулярно-клеточного до организменного. Освещены современные представления о механизмах развития нервных и психических заболеваний, а также приведены новые ...
Added: May 20, 2013
Кузнецов Д. С., Естественные и технические науки 2009 № 4 С. 365-369
В данной статье рассматривается фильтр Винера в качестве метода повышения эффективности работы систем распознавания речи. Приводятся сведения о возможных модификациях фильтра Винера для повышения степени шумоподавления. Рассматривается алгоритм работы программной реализации классического фильтра Винера и его модификаций. ...
Added: February 21, 2013
Maxim Borisyak, Zykov R., Noskov A., / Cornell University. Series arxiv :: cs :: Cornell University "arxiv :: cs :: Cornell University". 2015.
Classical approaches in recommender systems such as collaborative filtering are concentrated mainly on static user preference extraction. This approach works well as an example for music recommendations when a user behavior tends to be stable over long period of time, however the most common situation in e-commerce is different which requires reactive algorithms based on ...
Added: November 9, 2015
Savchenko L., Информационные технологии 2019 Т. 25 № 5 С. 313-318
We consider a problem of computer assisted language and pronunciation learning based on the deep learning methods and the information theory of speech perception. In order to improve the efficiency of testing of pronunciation quality, we propose to train a convolutional neural network using the best reference utterances from the user. The experimental results proved ...
Added: May 29, 2019
Demkin V. M., Sosnin A., Сусманова С. С., Онтология проектирования 2014 № 3(13) С. 63-76
Discussed in the paper are modern approaches to the design of complicated intellectual computer systems assessing foreign language proficiency, e.g. checking students’ academic progress in a higher educational establishment. The paper provides insight into the means to develop ontology-based situation models in the tasks requiring that a person’s command of English be assessed, which is ...
Added: October 24, 2012