?
Impact of ASR performance on free speaking language assessment
P. 1641–1645.
Knill K., Gales M., Kyriakopoulos K., Малинин А. А., Ragni A., Wang Y., Caines A.
Klyachko Elena, Grebenkin D., Nosenko D. и др., , in: Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной международной конференции «Диалог» (Москва, 16–19 июня 2021 г.)Issue 20.: Russian State University for the Humanitie, 2021.
Добавлено: 29 сентября 2021 г.
Савченко Л. В., Информационные технологии 2020 Т. 26 № 5 С. 290–296
В статье рассматривается задача распознавания изолированных слов с помощью методов глубокого обучения и сверточных нейронных сетей. Предложено выполнить дообучение сетей для проведения адаптации акустических моделей на голос диктора с использованием малого числа произнесенных им реализаций эталонных слов. Для понижения вероятности ошибочного распознавания рассматривается комбинирование нескольких различных дообученных дикторозависимых нейросетевых моделей. ...
Добавлено: 2 сентября 2020 г.
Савченко Л. В., Информационные технологии 2019 Т. 25 № 5 С. 313–318
Рассматривается задача постановки произношения на основе применения методов глубокого обучения совместно с информационной теорией восприятия речи. Для повышения эффективности тестирования качества произношения предложено проводить дообучение сверточной нейронной сети с использованием наилучших эталонов пользователя. Экспериментально показано, что предложенный подход характеризуется высокой точность и скоростью распознавания для различных акустических моделей по сравнению с известными аналогами. ...
Добавлено: 29 мая 2019 г.
Савченко А. В., , in: International Joint Conference on Rough Sets, Springer, Cham.: Springer, 2017. P. 264–277.
Добавлено: 26 октября 2018 г.
Попова А. С., Alexandr G. Rassadin, Alexander A. Ponomarenko, , in: Advances in Neural Computation, Machine Learning, and Cognitive Research. Selected Papers from the XIX International Conference on Neuroinformatics, October 2-6, 2017, Moscow, RussiaVol. 736.: Cham: Springer, 2017. P. 117–124.
Добавлено: 18 октября 2017 г.
А. С. Попова, А. Г. Рассадин, А. А. Пономаренко, В кн.: Материалы XXIII международной научно-технической конференции «Информационные системы и технологии-2017».: [б.и.], 2017. С. 852–857.
Рассматривается задача автоматической классификации эмоций в цифровом аудио сигнале. В работе рассматривается и верифицируется подход, в котором классификации звукового фрагмента сводится к задаче распознавания изображений. В качестве визуально представления использовались изображение спектрограммы и осциллограммы. Произведен численный эксперимент на открытом наборе данных Ravdess, включающий 8 различных эмоций: “нейтральный”, “спокойный”, “счастливый”, “грустный”, “злой”, “испуганный”, “отвращение”, “удивление”. Наилучшие ...
Добавлено: 18 октября 2017 г.
Романов А. Ю., Американов А. А., Лежнев Е. В. и др., Прикладная радиоэлектроника 2016 Т. 15 № 2 С. 123–126
Представлено описание разработки роботизированной платформы для помещений. Универсальность платформы дает возможность ее применения в различных областях человеческой жизнедеятельности, как при дистанционном управлении, так и в автономном режиме. Описаны этапы создания роботизированной платформы, приведены ее характеристики и представлены результаты ее работы. ...
Добавлено: 7 октября 2016 г.
Савченко А. В., Savchenko V.V., Journal of Communications Technology and Electronics 2016 Vol. 61 No. 4 P. 430–435
Добавлено: 11 апреля 2016 г.
Савченко А. В., Савченко В. В., Радиотехника и электроника 2016 Т. 61 № 4 С. 373–379
Рассмотрен метод фонетического кодирования–декодирования слов в задаче автоматического распознавания речи. На основе свойств информационного рассогласования Кульбака–Лейблера синтезирована оценка распределения рассогласования между минимальными речевыми единицами типа отдельных фонем внутри одного класса. Показано, что наименьшая дисперсия внутрифонемного рассогласования достигается при настройке фонетической базы данных на голос конкретного (одного) диктора. Полученные оценки подтверждены результатам экспериментальных исследований в задаче ...
Добавлено: 8 октября 2015 г.
Савченко А. В., Savchenko Lyudmila V., Pattern Recognition Letters 2015 Vol. 65 P. 145–151
The key purpose of this paper is to train a voice control system if a small amount of user speech data is available without need for general acoustic model if the latter does not fit to the user voice due to known variability sources (childhood, voice diseases, non-nativeness, etc.). We explore the possibility to increase ...
Добавлено: 10 сентября 2015 г.
Савченко А. В., Savchenko L. V., Lecture Notes in Artificial Intelligence 2014 Vol. 8536 P. 309–318
Добавлено: 25 июля 2014 г.
Савченко А. В., Lecture Notes in Computer Science 2014 Vol. 8509 P. 638–646
Добавлено: 25 июля 2014 г.
Савченко А. В., Journal of Communications Technology and Electronics 2014 Vol. 59 No. 4 P. 339–345
A phonetic approach to the problem of automatic recognition of isolated words is investigated.The phonetic encoding method whereby each word from a vocabulary is associated with the code sequenceof stable phonemes is proposed. The informationtheoretical estimate of vocabulary confusability, the calcuations of which rely on the phonetic database of a speaker and the communications channel ...
Добавлено: 8 апреля 2014 г.
Гостев И. М., Ермилов А. В., Известия Юго-Западного государственного университета 2011 № 2 С. 15–22
Исследуются методы применения машины опорных векторов (Support Vector Machine -SVM) с разными типами ядер к задаче идентификации диктора. В качестве входных данных используются Фишеровские признаки для разных типов каналов (телефон и GSM, микрофон). Анализируется точность идентификации при варьировании длительности сообщения. ...
Добавлено: 31 января 2014 г.
Савченко А. В., В кн.: Нелинейная динамика в когнитивных исследованиях-2013. Труды III Всероссийской конференции.: Н. Новгород: Институт прикладной физики РАН, 2013. С. 144–147.
В работе рассмотрены основные алгоритмы и их программная реализация на платформе Silverlight 4, которые могут применяться для переноса в режим дистанционного обучения систем обучения языку программ "Профессор Хиггинс" компании "ИстраСофт". ...
Добавлено: 21 сентября 2013 г.
Савченко А. В., Automation and Remote Control 2013 Vol. 74 No. 7 P. 1225–1232
The prototype of the isolated words recognition software based on the phonetic decoding method with the Kullback-Leibler divergence is presented. The architecture and basic algorithms of the software are described. Finally, an example of application to the problem of isolated words recognition is provided. ...
Добавлено: 1 августа 2013 г.
Савченко А. В., Savchenko L. V., Lecture Notes in Artificial Intelligence 2013 Vol. 7911 P. 176–183
The definition of a phoneme as a fuzzy set of minimal speech units from the model database is proposed. On the basis of this definition and the Kullback-Leibler minimum information discrimination principle the novel phoneme recognition algorithm has been developed as an enhancement of the phonetic decoding method. The experimental results in the problems of ...
Добавлено: 16 июня 2013 г.
Кузнецов Д. С., Естественные и технические науки 2009 № 4 С. 365–369
В данной статье рассматривается фильтр Винера в качестве метода повышения эффективности работы систем распознавания речи. Приводятся сведения о возможных модификациях фильтра Винера для повышения степени шумоподавления. Рассматривается алгоритм работы программной реализации классического фильтра Винера и его модификаций. ...
Добавлено: 21 февраля 2013 г.