• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • A
  • A
  • A
  • A
  • A
Обычная версия сайта
  • RU
  • EN
  • Национальный исследовательский университет «Высшая школа экономики»
  • Публикации ВШЭ
  • Глава
  • Audio-Visual Speech Recognition In-The-Wild: Multi-Angle Vehicle Cabin Corpus and Attention-Based Method
  • RU
  • EN
Расширенный поиск
Высшая школа экономики
Национальный исследовательский университет
Приоритетные направления
  • бизнес-информатика
  • государственное и муниципальное управление
  • гуманитарные науки
  • инженерные науки
  • компьютерно-математическое
  • математика
  • менеджмент
  • право
  • социология
  • экономика
по году
  • 2027
  • 2026
  • 2025
  • 2024
  • 2023
  • 2022
  • 2021
  • 2020
  • 2019
  • 2018
  • 2017
  • 2016
  • 2015
  • 2014
  • 2013
  • 2012
  • 2011
  • 2010
  • 2009
  • 2008
  • 2007
  • 2006
  • 2005
  • 2004
  • 2003
  • 2002
  • 2001
  • 2000
  • 1999
  • 1998
  • 1997
  • 1996
  • 1995
  • 1994
  • 1993
  • 1992
  • 1991
  • 1990
  • 1989
  • 1988
  • 1987
  • 1986
  • 1985
  • 1984
  • 1983
  • 1982
  • 1981
  • 1980
  • 1979
  • 1978
  • 1977
  • 1976
  • 1975
  • 1974
  • 1973
  • 1972
  • 1971
  • 1970
  • 1969
  • 1968
  • 1967
  • 1966
  • 1965
  • 1964
  • 1963
  • 1958
  • еще
Тематика
Новости
15 мая 2026 г.
В НИУ ВШЭ разрабатывают нейросеть для сферы науки и инноваций
Исследователи НИУ ВШЭ учат большие языковые модели понимать русскоязычную научную терминологию, увеличивая при этом их энергоэффективность. Адаптированная модель работает в 2,7 раза быстрее и требует на 73% меньше памяти, чем исходная открытая модель, что позволяет запускать ее на более доступном оборудовании. Программа прошла государственную регистрацию.
15 мая 2026 г.
Стартовал совместный спецпроект бренд-медиа Вышки IQ Media и iFORA ИСИЭЗ
В мае 2026 года стартовал научно-популярный проект «Искусственный интеллект: технологии, данные и будущее», который стал результатом работы двух команд — проекта iFORA Института статистических исследований и экономики знаний НИУ ВШЭ и редакции бренд-медиа IQMedia. Медийно-аналитический спецпроект посвящен современному развитию искусственного интеллекта и аналитике больших данных.
14 мая 2026 г.
<a>Ученые ФКН ВШЭ представили работы в сфере ИИ и биоинформатики на ICLR 2026
Ученые Института искусственного интеллекта и цифровых наук факультета компьютерных наук ВШЭи студенты трека «ИИ360: Инженерия искусственного интеллекта» бакалаврской программы «Прикладная математика и информатика» приняли участие в международной конференции ICLR — одном из самых авторитетных мировых форумов в области машинного обучения и представления данных. В этом году конференция состоялась в Рио-де-Жанейро (Бразилия).

 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!

Публикации
  • Книги
  • Статьи
  • Главы в книгах
  • Препринты
  • Верификация публикаций
  • Расширенный поиск
  • Правила использования материалов
  • Наука в ВШЭ

?

Audio-Visual Speech Recognition In-The-Wild: Multi-Angle Vehicle Cabin Corpus and Attention-Based Method

P. 8195–8199.
Axyonov Alexandr, Ryumin Dmitry, Ivanko D., Kashevnik A., Karpov A.
Язык: английский
DOI
Текст на другом сайте
Ключевые слова: VisualizationSignal processingBenchmark testingAttention MechanismNoise robustnessHuman computer interaction (HCI)Audio-visual speech recognitionFeature-level fusionSpeech recognitionNoise measurementMulti-modal signal processingSpatio-temporal features

В книге

IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2024)
IEEE, 2024.
Похожие публикации
Spatiotemporal dynamics in a network of modified Morris–Lecar neurons with nonlinear magnetic flux diffusion
Сералан В., S L. L., Kunchala S. B. и др., European Physical Journal: Special Topics 2025 Vol. 234 P. 1073–1091
Добавлено: 15 октября 2025 г.
Rhythm-based hierarchical predictive computations support acoustic−semantic transformation in speech processing
Догонашева О. А., Doelling K., Захаров Д. Г. и др., Nature Computational Science 2025 Vol. 5 P. 915–926
Раскрытие того, как человек способен понимать речь, несмотря на искажения, уже давно привлекает внимание исследователей. Одной из ведущих гипотез является предположение о том, что множество эндогенных мозговых ритмов формируют вычислительный контекст для предсказания структуры и содержания речи. Однако до сих пор неясно, каким образом нейронные процессы могут реализовывать формирование такого ритм-основанного контекста. В данной работе мы ...
Добавлено: 2 сентября 2025 г.
Causes in neuron diagrams, and testing causal reasoning in Large Language Models. A glimpse of the future of philosophy?
Вервурт Л. П., Journal for General Philosophy of Science 2025
Добавлено: 26 августа 2025 г.
ISCA International Conference INTERSPEECH
International Society for Computers and Their Applications (ISCA), 2024.
Добавлено: 6 марта 2025 г.
IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2024)
IEEE, 2024.
Добавлено: 6 марта 2025 г.
OCEAN-AI framework with EmoFormer cross-hemiface attention approach for personality traits assessment
Elena Ryumina, Markitantov M., Dmitry Ryumin и др., Expert Systems with Applications 2024 Vol. 239 P. 0
Добавлено: 6 марта 2025 г.
Audio-visual speech recognition based on regulated transformer and spatio–temporal fusion strategy for driver assistive systems
Dmitry Ryumin, Alexandr Axyonov, Elena Ryumina и др., Expert Systems with Applications 2024 Vol. 252 Article 124159
Добавлено: 6 марта 2025 г.
High-speed optical-waveguide integrated single-walled carbon nanotube bolometer
An P. P., V. V. Kovalyuk, Y. G. Gladush и др., Applied Physics Letters 2024 Vol. 125 No. 20 Article 201101
Добавлено: 11 ноября 2024 г.
2024 IEEE 18th International Conference on Application of Information and Communication Technologies (AICT 2024), 25 - 27 Serptember 2024, Turin, Italy
Turin: Institute of Electrical and Electronics Engineers, 2024.
Добавлено: 7 ноября 2024 г.
Analyzing the Robustness of Vision & Language Models
Ширнин А. А., Andreev N., Potapova S. и др., IEEE/ACM Transactions on Speech and Language Processing 2024 Vol. 32 P. 2751–2763
We present an approach to evaluate the robustness of pre-trained vision and language (V&L) models to noise in input data. Given a source image/text, we perturb it using standard computer vision (CV) / natural language processing (NLP) techniques and feed it to a V&L model. To track performance changes, we explore the problem of visual ...
Добавлено: 19 июля 2024 г.
2023 Seminar on Signal Processing
IEEE, 2023.
Добавлено: 10 февраля 2024 г.
10th International Conference, PReMI 2023, Kolkata, India, December 12–15, 2023, Proceedings. Pattern Recognition and Machine Intelligence. LNCS, volume 14301
Cham: Springer, 2023.
Добавлено: 29 ноября 2023 г.
ICASSP 2023 - 2023 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 4-10 June 2023
IEEE, 2023.
Добавлено: 5 ноября 2023 г.
InterSpeech 2023. Dublin, Ireland, 20-24 August 2023
International Speech Communication Association, 2023.
Добавлено: 5 ноября 2023 г.
2023 IEEE 17th International Conference on Application of Information and Communication Technologies (AICT)
Baku: IEEE, 2023.
Добавлено: 4 ноября 2023 г.
InterSpeech 2022
International Speech Communication Association, 2022.
Добавлено: 31 октября 2022 г.
2022 IEEE 16th International Conference on Application of Information and Communication Technologies (AICT)
Washington: IEEE, 2022.
Добавлено: 29 октября 2022 г.
Self-supervised recurrent depth estimation with attention mechanisms
Макаров И. А., Bakhanova M., Nikolenko S. и др., PeerJ Computer Science 2022 Vol. 8 Article e865
Depth estimation has been an essential task for many computer vision applications, especially in autonomous driving, where safety is paramount. Depth can be estimated not only with traditional supervised learning but also via a self-supervised approach that relies on camera motion and does not require ground truth depth maps. Recently, major improvements have been introduced ...
Добавлено: 1 февраля 2022 г.
Embedded ArUco: a novel approach for high precision UAV landing
Khazetdinov A., Zakiev A., Tsoy T. и др., , in: 2022 International Siberian Conference on Control and Communications (SIBCON).: IEEE, 2022. Ch. 9438855.
Добавлено: 11 октября 2021 г.
  • О ВЫШКЕ
  • Цифры и факты
  • Руководство и структура
  • Устойчивое развитие в НИУ ВШЭ
  • Преподаватели и сотрудники
  • Корпуса и общежития
  • Закупки
  • Обращения граждан в НИУ ВШЭ
  • Фонд целевого капитала
  • Противодействие коррупции
  • Сведения о доходах, расходах, об имуществе и обязательствах имущественного характера
  • Сведения об образовательной организации
  • Людям с ограниченными возможностями здоровья
  • Единая платежная страница
  • Работа в Вышке
  • ОБРАЗОВАНИЕ
  • Лицей
  • Довузовская подготовка
  • Олимпиады
  • Прием в бакалавриат
  • Вышка+
  • Прием в магистратуру
  • Аспирантура
  • Дополнительное образование
  • Центр развития карьеры
  • Бизнес-инкубатор ВШЭ
  • Образовательные партнерства
  • Обратная связь и взаимодействие с получателями услуг
  • НАУКА
  • Научные подразделения
  • Исследовательские проекты
  • Мониторинги
  • Диссертационные советы
  • Защиты диссертаций
  • Академическое развитие
  • Конкурсы и гранты
  • Внешние научно-информационные ресурсы
  • РЕСУРСЫ
  • Библиотека
  • Издательский дом ВШЭ
  • Книжный магазин «БукВышка»
  • Типография
  • Медиацентр
  • Журналы ВШЭ
  • Публикации
  • http://www.minobrnauki.gov.ru/
    Министерство науки и высшего образования РФ
  • https://edu.gov.ru/
    Министерство просвещения РФ
  • http://www.edu.ru
    Федеральный портал «Российское образование»
  • https://elearning.hse.ru/mooc
    Массовые открытые онлайн-курсы
  • НИУ ВШЭ1993–2026
  • Адреса и контакты
  • Условия использования материалов
  • Политика конфиденциальности
  • Правила применения рекомендательных технологий в НИУ ВШЭ
  • Карта сайта
Редактору