?
Краткий обзор приложения метода условных случайных полей в области распознавания речи
Речевые технологии. 2013. № 4. С. 127-134.
Вознесенская Т. В., Леднов Д. А.
Цель этой работы обзор математических основ модели условных случайных полей, а так же идеологическое сравнение этой модели с другими известными направлениями обработки речи.
Научное направление:
Компьютерные науки
Язык:
русский
Ключевые слова: автоматическое распознавание речи
Савченко А. В., Информационные системы и технологии 2014 № 2 С. 12-18
Предложен новый критерий сегментации речи, основанный на идее вероятностной нейронной сети с проверкой однородности. Экспериментально продемонстрировано, что предложенный подход позволяет на 2-7% повысить точность распознавания гласных звуков в слоге по сравнению с традиционным критерием, основанным на сопоставлении с фиксированным порогом расстояния между очередным фреймом и предыдущим однородным участком ...
Добавлено: 26 марта 2014 г.
Савченко А. В., Савченко Л. В., Вестник компьютерных и информационных технологий 2013 № 3 С. 36-41
В рамках информационной теории восприятия речи предложено определение фонемы как нечеткого множества минимальных речевых единиц. На основе данного определения и принципа минимума информационного рассогласования в развитие известного метода фонетического декодирования слов синтезирован новый алгоритм распознавания фонем. Представлены результаты его экспериментального исследования для распознавания гласных звуков русского языка. ...
Добавлено: 27 апреля 2013 г.
Савченко А. В., Информационные технологии 2014 № 1 С. 53-57
Рассмотрена задача автоматического выделения голосовых команд из непрерывного речевого потока и их последующего распознавания. Для обнаружения в слогах границ гласных звуков используется основанный на идее вероятностной нейронной сети с проверкой однородности алгоритм фонемной сегментации речи. Предложено считать речевой сигнал частью голосовой команды, если доля длительности выделенного в нем однородного сегмента по отношению к длительности всего ...
Добавлено: 20 января 2014 г.
Савченко А. В., Savchenko Lyudmila V., Pattern Recognition Letters 2015 Vol. 65 P. 145-151
The key purpose of this paper is to train a voice control system if a small amount of user speech data is available without need for general acoustic model if the latter does not fit to the user voice due to known variability sources (childhood, voice diseases, non-nativeness, etc.). We explore the possibility to increase ...
Добавлено: 10 сентября 2015 г.
Савченко А. В., Акатьев Д. Ю., Информационные системы и технологии 2013 № 3 (77) С. 5-12
Рассмотрена проблема вариативности разговорной речи в задаче формирования фонетической базы данных. Для её решения предложено использование автоматической сегментации речи на последовательность фонем на основе когнитивной акустической модели типа фонетического кластера, определённого на множестве минимальных звуковых единиц. Разработан адаптивный алгоритм наполнения каждого кластера одноименными минимальными звуковыми единицами из непрерывного потока речи диктора. Представлены результаты экспериментального исследования ...
Добавлено: 7 мая 2013 г.
Губочкин И. В., Карпов Н. В., Информационно-управляющие системы 2013 № 5(66) С. 34-42
Решается задача кластеризации множества авторегрессионных моделей речевых сигналов в рамках теоретико-информационного подхода. Для этого был разработан алгоритм нахождения оптимальных параметров авторегрессионной модели в смысле минимума информационного рассогласования Кульбака – Лейблера. На его основе проведена модификации известного алгоритма кластеризации k-средних. Экспериментально исследована эффективность применения разработанных алгоритмов при дикторонезависимом распознавании изолированных слов с использованием аппарата скрытых марковских ...
Добавлено: 2 декабря 2013 г.
Савченко А. В., Информационные технологии 2013 № 4 С. 34-39
Ставится и решается задача автоматического распознавания речи для системы голосового управления. Предложен адаптивный алгоритм распознавания, на первом этапе которого для всех выделенных слогов распознаются гласные фонемы, а на втором происходит уточнение произнесенных слогов. Показано, что такой подход приводит к созданию высоконадежной обучаемой системы, в которой продолжительность настройки под диктора на порядок ниже аналогичного показателя для ...
Добавлено: 13 апреля 2013 г.
Berlin, Heidelberg : Springer, 2012
Добавлено: 21 сентября 2012 г.
Савченко А. В., Savchenko V.V., Journal of Communications Technology and Electronics 2016 Vol. 61 No. 4 P. 430-435
Добавлено: 11 апреля 2016 г.
Губочкин И. В., Моделирование и анализ информационных систем 2013 Т. 20 № 2 С. 23-33
Рассмотрена задача оценки параметров авторегрессионной модели элементарных речевых единиц типа фонем. Предложен итерационный алгоритм поиска авторегрессионной модели фонемы, заданной множеством ее реализаций, в основе которого лежит метод Ньютона, предназначенный для численной минимизации функций. Для этого были получены аналитические выражения для градиента и гессиана величины информационного рассогласования Кульбака–Лейблера между моделями авторегрессии. В ходе экспериментальных исследований на ...
Добавлено: 2 декабря 2013 г.
Савченко А. В., Lecture Notes in Computer Science 2014 Vol. 8509 P. 638-646
Добавлено: 25 июля 2014 г.
Савченко А. В., Савченко Л. В., Радиотехника и электроника 2019 Т. 64 № 3 С. 274-280
Исследован фонетический подход для систем обработки голосовой информации. Разработан метод автоматического распознавания речевых сигналов, в котором каждому квазистационарному сегменту ставится в соответствие нечеткое множество фонем. Предложено использовать операцию вероятностной треугольной нормы для нечетких множеств, соответствующих входному фрейму и ближайшей к нему эталонной фонемы. Экспериментально показано, что разработанный метод позволяет на 1.5…5% снизить вероятность ошибочного распознавания ...
Добавлено: 18 марта 2019 г.
Савченко А. В., Lecture Notes in Artificial Intelligence 2017 Vol. 10314 P. 264-277
Добавлено: 27 июня 2017 г.
Савченко А. В., Савченко В. В., Информационно-управляющие системы 2013 № 2 С. 7-12
Предложена новая разновидность метода фонетического декодирования слов в расчете на ограниченное множество минимальных звуковых единиц типа отдельных фонем как альтернатива большинству известных методов распознавания речи, основанных на скрытых марковских моделях речевых сигналов. В ее основе используется идея многократного (на порядок и более) сжатия данных за счет того, что слова и фразы из словаря отображаются на ...
Добавлено: 23 апреля 2013 г.
Савченко А. В., Савченко В. В., Радиотехника и электроника 2016 Т. 61 № 4 С. 373-379
Рассмотрен метод фонетического кодирования–декодирования слов в задаче автоматического распознавания речи. На основе свойств информационного рассогласования Кульбака–Лейблера синтезирована оценка распределения рассогласования между минимальными речевыми единицами типа отдельных фонем внутри одного класса. Показано, что наименьшая дисперсия внутрифонемного рассогласования достигается при настройке фонетической базы данных на голос конкретного (одного) диктора. Полученные оценки подтверждены результатам экспериментальных исследований в задаче ...
Добавлено: 8 октября 2015 г.
Савченко А. В., Savchenko L. V., Lecture Notes in Artificial Intelligence 2013 Vol. 7911 P. 176-183
The definition of a phoneme as a fuzzy set of minimal speech units from the model database is proposed. On the basis of this definition and the Kullback-Leibler minimum information discrimination principle the novel phoneme recognition algorithm has been developed as an enhancement of the phonetic decoding method. The experimental results in the problems of ...
Добавлено: 16 июня 2013 г.
Белгород : Белгородский государственный технологический университет им. В.Г. Шухова, 2012
Важность проведения очередной тринадцатой национальной конференции по искусственному интеллекту (КИИ-2012) обусловлена необходимостью обмена научной информацией и последними достижениями в данной области. В обсуждении фундаментальных теоретических и прикладных проблем, возникающих при создании интеллектуальных систем, принимают участие ведущие ученые и специалисты из академических институтов, научных и промышленных организаций, а также вузов России, стран ближнего и дальнего зарубежья. ...
Добавлено: 13 ноября 2012 г.
В работе обсуждаются современные подходы к проектированию сложных интеллектуальных систем компьютерного контроля знаний иностранного языка, использующихся, в частности, для поддержки учебного процесса в высшем учебном заведении. Исследуются механизмы построения онтологических моделей ситуаций в задачах компьютерного контроля знаний английского языка в рамках парадигмы ограниченной рациональности.
На примере личных местоимений проиллюстрированы характерные особенности поведения холонов, взявших на себя ...
Добавлено: 24 октября 2012 г.
Савченко А. В., Вестник компьютерных и информационных технологий 2014 № 3 С. 30-37
Рассмотрен подход к решению задачи распознавания изолированных слов русской речи для систем голосового управления
на основе метода фонетического декодирования. В рамках теоретико-информационного подхода предложено нахождение неопределенности рабочего словаря как величины условной энтропии канала с шумами, на вход которого поступает некоторое слово
из словаря, а на выходе появляется распознаваемый речевой сигнал. На основе свойств информационного рассогласования Кульбака–Лейблера представлена ...
Добавлено: 26 марта 2014 г.
В данной статье описан детектор, работа которого основана, на таком устойчивом признаке речи, отличающем ее от всех прочих шумов, как наличие вокализованных интервалов. ...
Добавлено: 20 ноября 2014 г.
Ермилов А. В., Известия Юго-Западного государственного университета 2011 № 2 С. 15-20
Исследуются методы применения машины опорных векторов (Support Vector Machine - SVM) с разными типами ядер к задаче идентификации диктора. В качестве входных данных используются Фишеровские признаки для разных типов каналов (телефон и GSM, микрофон). Анализируется точность идентификации при варьировании длительности сообщения. ...
Добавлено: 18 января 2014 г.
Ружицкая Д. Д., САМОЙЛЕНКО А. А., Иванов А. Д. и др., Optoelectronics, Instrumentation and Data Processing 2017 Vol. 54 No. 1 P. 1-8
This paper presents an algorithm for processing the transmission spectra of whisperinggallery optical microcavities for use as a nanoparticle detector. The algorithm is based on the broadening of the microcavity resonance curve during precipitation of nanoparticles on the microcavity surface. Experimental results on the detection of particles are compared with Langmuir adsorption theory. The contribution ...
Добавлено: 25 мая 2018 г.
Беклемишев Л. Д., Оноприенко А. А., Математический сборник 2015 Т. 206 № 9 С. 3-20
Формулируются системы преобразований термов, число шагов работы которых на произвольном входе конечно, но не ограничивается никакой вычислимой функцией, доказуемо тотальной в арифметике Пеано PА. Тем самым, утверждение о сходимости таких систем не доказуемо в PA. Эти системы получаются из независимого комбинаторного утверждения, известного как принцип червя; их также можно рассматривать как вариант хорошо известной игры Геракла и гидры, ...
Добавлено: 13 марта 2016 г.
Borchmann D., Hanika T., Объедков С. А., Discrete Applied Mathematics 2020 Vol. 273 P. 30-42
Добавлено: 29 октября 2019 г.