?
Fuzzy Phonetic Decoding Method in a Phoneme Recognition Problem
Lecture Notes in Artificial Intelligence. 2013. Vol. 7911. P. 176-183.
Savchenko A., Savchenko L. V.
The definition of a phoneme as a fuzzy set of minimal speech units from the model database is proposed. On the basis of this definition and the Kullback-Leibler minimum information discrimination principle the novel phoneme recognition algorithm has been developed as an enhancement of the phonetic decoding method. The experimental results in the problems of isolated vowels recognition and word recognition in Russian are presented. It is shown that the proposed method is characterized by the increase of recognition accuracy and reliability in comparison with the phonetic decoding method
Keywords: автоматическое распознавание речинечеткие множествапринцип минимума информационного рассогласования Кульбака-Лейблераfuzzy setsKullback-Leibler minimum information discrimination principleметод фонетического декодированияspeech recognitionphonetic decoding method
Publication based on the results of:
Savchenko A., Савченко В. В., Радиотехника и электроника 2016 Т. 61 № 4 С. 373-379
Рассмотрен метод фонетического кодирования–декодирования слов в задаче автоматического распознавания речи. На основе свойств информационного рассогласования Кульбака–Лейблера синтезирована оценка распределения рассогласования между минимальными речевыми единицами типа отдельных фонем внутри одного класса. Показано, что наименьшая дисперсия внутрифонемного рассогласования достигается при настройке фонетической базы данных на голос конкретного (одного) диктора. Полученные оценки подтверждены результатам экспериментальных исследований в задаче ...
Added: October 8, 2015
Savchenko A., Savchenko V.V., Journal of Communications Technology and Electronics 2016 Vol. 61 No. 4 P. 430-435
A words phonetic decoding method in automatic speech recognition is considered. The properties of Kullback–Leibler divergence are used to synthesize the estimation of the distribution of divergence between minimum speech units (e.g., single phonemes) inside a single class. It is demonstrated that the min imum variance of the intraphonemic divergence is reached when the phonetic ...
Added: April 11, 2016
Savchenko A., Савченко Л. В., Вестник компьютерных и информационных технологий 2013 № 3 С. 36-41
В рамках информационной теории восприятия речи предложено определение фонемы как нечеткого множества минимальных речевых единиц. На основе данного определения и принципа минимума информационного рассогласования в развитие известного метода фонетического декодирования слов синтезирован новый алгоритм распознавания фонем. Представлены результаты его экспериментального исследования для распознавания гласных звуков русского языка. ...
Added: April 27, 2013
Savchenko A., Automation and Remote Control 2013 Vol. 74 No. 7 P. 1225-1232
The prototype of the isolated words recognition software based on the phonetic decoding method with the Kullback-Leibler divergence is presented. The architecture and basic algorithms of the software are described. Finally, an example of application to the problem of isolated words recognition is provided. ...
Added: August 1, 2013
Savchenko A., Journal of Communications Technology and Electronics 2014 Vol. 59 No. 4 P. 339-345
A phonetic approach to the problem of automatic recognition of isolated words is investigated.The phonetic encoding method whereby each word from a vocabulary is associated with the code sequenceof stable phonemes is proposed. The informationtheoretical estimate of vocabulary confusability, the calcuations of which rely on the phonetic database of a speaker and the communications channel ...
Added: April 8, 2014
Savchenko A., Savchenko L., Радиотехника и электроника 2019 Т. 64 № 3 С. 274-280
Исследован фонетический подход для систем обработки голосовой информации. Разработан метод автоматического распознавания речевых сигналов, в котором каждому квазистационарному сегменту ставится в соответствие нечеткое множество фонем. Предложено использовать операцию вероятностной треугольной нормы для нечетких множеств, соответствующих входному фрейму и ближайшей к нему эталонной фонемы. Экспериментально показано, что разработанный метод позволяет на 1.5…5% снизить вероятность ошибочного распознавания ...
Added: March 18, 2019
Savchenko A., Вестник компьютерных и информационных технологий 2014 № 3 С. 30-37
Рассмотрен подход к решению задачи распознавания изолированных слов русской речи для систем голосового управления
на основе метода фонетического декодирования. В рамках теоретико-информационного подхода предложено нахождение неопределенности рабочего словаря как величины условной энтропии канала с шумами, на вход которого поступает некоторое слово
из словаря, а на выходе появляется распознаваемый речевой сигнал. На основе свойств информационного рассогласования Кульбака–Лейблера представлена ...
Added: March 26, 2014
Savchenko A., Акатьев Д. Ю., Информационные системы и технологии 2013 № 3 (77) С. 5-12
Рассмотрена проблема вариативности разговорной речи в задаче формирования фонетической базы данных. Для её решения предложено использование автоматической сегментации речи на последовательность фонем на основе когнитивной акустической модели типа фонетического кластера, определённого на множестве минимальных звуковых единиц. Разработан адаптивный алгоритм наполнения каждого кластера одноименными минимальными звуковыми единицами из непрерывного потока речи диктора. Представлены результаты экспериментального исследования ...
Added: May 7, 2013
Savchenko A., Lecture Notes in Artificial Intelligence 2017 Vol. 10314 P. 264-277
In this paper it is proposed to improve performance of the automatic speech recognition by using sequential three-way decisions. At first, the largest piecewise quasi-stationary segments are detected in the speech signal. Every segment is classified using the maximum a-posteriori (MAP) method implemented with the Kullback-Leibler minimum information discrimination principle. The three-way decisions are taken ...
Added: June 27, 2017
Poelmans J., Ignatov D. I., Kuznetsov S. et al., International Journal of General Systems 2014 Vol. 43 No. 2 P. 105-134
Formal Concept Analysis (FCA) is a mathematical technique that has been extensively applied to Boolean data in knowledge discovery, information retrieval, web mining, etc. applications. During the past years, the research on extending FCA theory to cope with imprecise and incomplete information made significant progress. In this paper, we give a systematic overview of the ...
Added: June 9, 2014
Savchenko A., Информационные технологии 2013 № 4 С. 34-39
Ставится и решается задача автоматического распознавания речи для системы голосового управления. Предложен адаптивный алгоритм распознавания, на первом этапе которого для всех выделенных слогов распознаются гласные фонемы, а на втором происходит уточнение произнесенных слогов. Показано, что такой подход приводит к созданию высоконадежной обучаемой системы, в которой продолжительность настройки под диктора на порядок ниже аналогичного показателя для ...
Added: April 13, 2013
Статистическое распознавание образов на основе вероятностной нейронной сети с проверкой однородности
Savchenko A., Искусственный интеллект и принятие решений 2013 № 4 С. 45-56
Statistical pattern recognition was reduced to the hypothesis test for homogeneity. The probabilistic neural network (PNN) modification was proposed to achieve its optimal decision in terms of minimum Bayes-risk. The comparative analysis' results of the proposed modification with an original PNN were presented in a problem of automatic author identification ...
Added: December 23, 2013
Savchenko A., Savchenko L. V., Lecture Notes in Artificial Intelligence 2014 Vol. 8536 P. 309-318
The problem of recognition of a sequence of objects (e.g., video-based image recognition, phoneme recognition) is explored. The generalization of the fuzzy phonetic decoding method is proposed by assuming the distribution of the classified object to be of exponential type. Its preliminary phase includes association of each model object with the fuzzy set of model ...
Added: July 25, 2014
Savchenko A., Информационные технологии 2014 № 1 С. 53-57
Рассмотрена задача автоматического выделения голосовых команд из непрерывного речевого потока и их последующего распознавания. Для обнаружения в слогах границ гласных звуков используется основанный на идее вероятностной нейронной сети с проверкой однородности алгоритм фонемной сегментации речи. Предложено считать речевой сигнал частью голосовой команды, если доля длительности выделенного в нем однородного сегмента по отношению к длительности всего ...
Added: January 20, 2014
Savchenko A., Lecture Notes in Computer Science 2014 Vol. 8509 P. 638-646
Since the early 1990s, speaker adaptation have become one of the intensive areas in speech recognition. State-of-the-art batch-mode adaptation algorithms assume that speech of particular speaker contains enough information about the user's voice. In this article we propose to allow the user to manually verify if the adaptation is useful. Our procedure requires the speaker ...
Added: July 25, 2014
Savchenko A., Savchenko Lyudmila V., Pattern Recognition Letters 2015 Vol. 65 P. 145-151
The key purpose of this paper is to train a voice control system if a small amount of user speech data is available without need for general acoustic model if the latter does not fit to the user voice due to known variability sources (childhood, voice diseases, non-nativeness, etc.). We explore the possibility to increase ...
Added: September 10, 2015
P., Beijing, Amsterdam : Atlantis Press, 2013
The 8th conference of the European Society for Fuzzy Logic and Technology, EUSFLAT-2013, took place in Milan, the industrial and business capital of Italy. The EUSFLAT 2013 Conference was hold at the premises of the University of Milano-Bicocca, Milan, Italy from September 11th to September 13th, 2013. The aim of the conference is to bring together theoreticians ...
Added: September 22, 2013
Savchenko A., Khokhlova Y. I., Optical Memory and Neural Networks (Information Optics) 2014 Vol. 23 No. 1 P. 34-42
The paper considers the phoneme recognition by facial expressions of a speaker in voice-activated control systems. We have developed a neural network recognition algorithm by using the phonetic words decoding method and the requirement for isolated syllable pronunciation of voice commands. The paper presents the experimental results of viseme (facial and lip position corresponding to ...
Added: March 26, 2014
Savchenko A., Системы управления и информационные технологии 2013 № 1(51) С. 71-75
Рассматривается экспериментальный образец программного комплекса распознавания изолированных слов на основе метода фонетического декодирования в информационной метрике Кульбака-Лейблера. Дается обзор его архитектуры и основных алгоритмов. Представлен пример практического применения в задаче распознавания изолированных слов ...
Added: April 2, 2013
Savchenko L., Информационные технологии 2019 Т. 25 № 5 С. 313-318
We consider a problem of computer assisted language and pronunciation learning based on the deep learning methods and the information theory of speech perception. In order to improve the efficiency of testing of pronunciation quality, we propose to train a convolutional neural network using the best reference utterances from the user. The experimental results proved ...
Added: May 29, 2019
Ermilov A., Известия Юго-Западного государственного университета 2011 № 2 С. 15-20
In this article we consider application of Support Vector Machines with different types of kernels to the task of speaker identification. We use Fisher features for several types of channels (telephone, GSM, microphone). We analyze dependence of accuracy from length of input sentence. ...
Added: January 18, 2014
Ведерников Ю. В., Евстафьев А. С., Protsenko D. S., Вопросы оборонной техники. Серия 16: Технические средства противодействия терроризму 2015 № 7-8 С. 22-30
Article considers theoretical prerequisites of creation of optimum hierarchical structure of system of monitoring of crucial parameters of food safety of Russia on the basis of application of the theory of indistinct sets. ...
Added: October 22, 2015
Berlin, Heidelberg : Springer, 2012
Added: September 21, 2012
Demkin V. M., Sosnin A., Сусманова С. С., Онтология проектирования 2014 № 3(13) С. 63-76
Discussed in the paper are modern approaches to the design of complicated intellectual computer systems assessing foreign language proficiency, e.g. checking students’ academic progress in a higher educational establishment. The paper provides insight into the means to develop ontology-based situation models in the tasks requiring that a person’s command of English be assessed, which is ...
Added: October 24, 2012