• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • A
  • A
  • A
  • A
  • A
Обычная версия сайта
  • RU
  • EN
  • Национальный исследовательский университет «Высшая школа экономики»
  • Публикации ВШЭ
  • Статьи
  • Analyzing the Robustness of Vision & Language Models
  • RU
  • EN
Расширенный поиск
Высшая школа экономики
Национальный исследовательский университет
Приоритетные направления
  • бизнес-информатика
  • государственное и муниципальное управление
  • гуманитарные науки
  • инженерные науки
  • компьютерно-математическое
  • математика
  • менеджмент
  • право
  • социология
  • экономика
по году
  • 2027
  • 2026
  • 2025
  • 2024
  • 2023
  • 2022
  • 2021
  • 2020
  • 2019
  • 2018
  • 2017
  • 2016
  • 2015
  • 2014
  • 2013
  • 2012
  • 2011
  • 2010
  • 2009
  • 2008
  • 2007
  • 2006
  • 2005
  • 2004
  • 2003
  • 2002
  • 2001
  • 2000
  • 1999
  • 1998
  • 1997
  • 1996
  • 1995
  • 1994
  • 1993
  • 1992
  • 1991
  • 1990
  • 1989
  • 1988
  • 1987
  • 1986
  • 1985
  • 1984
  • 1983
  • 1982
  • 1981
  • 1980
  • 1979
  • 1978
  • 1977
  • 1976
  • 1975
  • 1974
  • 1973
  • 1972
  • 1971
  • 1970
  • 1969
  • 1968
  • 1967
  • 1966
  • 1965
  • 1964
  • 1963
  • 1958
  • еще
Тематика
Новости
2 июня 2026 г.
НИУ ВШЭ представил исследования и проекты зеркальной лаборатории с УрФУ на USBEREIT
В мае в Екатеринбурге, Москве и Астане прошла Урало-Сибирская конференция IEEE по биомедицинской инженерии, радиоэлектронике и информационным технологиям (USBEREIT). Ученые из НИУ ВШЭ представили результаты своих исследований и проекты зеркальной лаборатории с Уральским федеральным университетом, в частности экспериментальный стенд модульного центра обработки данных и новый подход, системно объединяющий данные и физические законы.
2 июня 2026 г.
Человеческий капитал перевешивает социальный: исследование факторов трудовой мобильности в России
Образование и здоровье оказываются важнее связей, блата и знакомств для мобильности российских работников на рынке труда. К такому выводу пришли ученые НИУ ВШЭ, проанализировав данные лонгитюдного обследования домохозяйств «Российский мониторинг экономического положения и здоровья населения НИУ ВШЭ» (РМЭЗ НИУ ВШЭ) за 2016–2019 годы. Главный фактор, который влияет на карьерную мобильность россиян, — получение высшего образования и улучшение самооценки здоровья.
1 июня 2026 г.
Ученые ВШЭ объяснили, как эмоции человека влияют на отношение к цифровому государству
Сегодня взаимодействие человека с государством все чаще происходит через цифровые платформы: порталы госуслуг, электронные сервисы, системы на основе искусственного интеллекта и алгоритмы принятия решений. Однако до сих пор такие технологии в основном рассматривались как технические инструменты, эффективность которых оценивают по скорости работы и удобству интерфейсов. Авторы нового исследования предлагают смотреть на цифровое управление шире — как на эмоциональный опыт, который напрямую влияет на доверие граждан к государству.

 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!

Публикации
  • Книги
  • Статьи
  • Главы в книгах
  • Препринты
  • Верификация публикаций
  • Расширенный поиск
  • Правила использования материалов
  • Наука в ВШЭ

?

Analyzing the Robustness of Vision & Language Models

IEEE/ACM Transactions on Speech and Language Processing. 2024. Vol. 32. P. 2751–2763.
Ширнин А. А., Andreev N., Potapova S., Артемова Е. Л.

We present an approach to evaluate the robustness of pre-trained vision and language (V&L) models to noise in input data. Given a source image/text, we perturb it using standard computer vision (CV) / natural language processing (NLP) techniques and feed it to a V&L model. To track performance changes, we explore the problem of visual questions answering (VQA). Overall, we utilize 5 image and 9 text perturbation techniques and probe three Transformer-based V&L models followed by a broad analysis of their behavior and a detailed comparison. We discovered several key findings regarding the performance of the models in relation to the impact of various perturbations. These discrepancies in performance can be attributed to differences in their architectures and learning objectives. Last, but not least, we perform an empirical study to assess whether the attention mechanism of V&L Transformers learns to align modalities. We hypothesize, that attention weights for related objects and words, should be on average higher than for random object/word pairs. However, our study shows that, unlike is believed for machine translation models, V&L models do not learn alignment at all or exhibit less evidence to do so. This may support the intuition that V&L Transformers overfit to either of the modalities.

Научное направление: Компьютерные науки
Язык: английский
Полный текст
DOI
Текст на другом сайте
Ключевые слова: computational modelingrobustnessVisualizationData modelsanalytical modelsTask analysisVisual question answeringtransformersAttention MechanismBlack-box InterpretationSpurious Correlations
ПУБЛИКАЦИЯ ПОДГОТОВЛЕНА ПО РЕЗУЛЬТАТАМ ПРОЕКТА:
Модели и методы анализа текстовых данных, рекомендательных систем и майнинга данных (2024)
Похожие публикации
OpenAtom Foundation. Консорциум, развивающий Open Source в Китае.
Силаков Д. В., Системный администратор 2026 № 3 С. 28–33
В статье про платформы для разработки открытого ПО в Китае мы рассказали про GitCode – молодой проект, позиционируемый как площадка для разработчиков со всего мира. Сейчас на GitCode размещаются проекты, созданные в КНР, но некоторые из них уже известны и на международной арене. Помочь открытым проектам в становлении, развитии и расширению аудитории призван фонд OpenAtom ...
Добавлено: 2 июня 2026 г.
The recognition-by-components method
Slivnitsin P., Мыльников Л. А., Engineering Applications of Artificial Intelligence 2026 Vol. 179 Article 115185
Добавлено: 29 мая 2026 г.
Brain-Computer Interfaces for Gait Rehabilitation After Stroke A Scoping Review
Мокиенко О. А., Zisman M. A., Бобров П. Д. и др., American Journal of Physical Medicine and Rehabilitation 2026 Vol. 105 No. 6 P. 555–563
Добавлено: 28 мая 2026 г.
ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ И ТЕХНИЧЕСКИЕ СРЕДСТВА УПРАВЛЕНИЯ (ICCT-2024)
М.: Институт проблем управления им. В.А. Трапезникова РАН, 2024.
В сборник вошли материалы VIII Международной научной конференции «Информационные технологии и технические средства управления» (ICCT-2024). На конференции были рассмотрены вопросы, касающиеся перспектив развития научного приборостроения в телекоммуникационных и управляющих системах, биомедицинской информатики, аппаратного и программного обеспечения информационнокоммуникационных систем, надежности, диагностики и неразрушающего контроля, систем управления и автоматизации, цифровых экосистем, управления производством и логистикой, методов математического ...
Добавлено: 27 мая 2026 г.
Non-linear in-band interference cancellation on base of conjugate gradients method
Degtyarev A., Bakhurin S., Юдин Н. Е., DSPA 2026 P. 1–6
Добавлено: 26 мая 2026 г.
28th European Conference on Artificial Intelligence, 25-30 October 2025, Bologna, Italy – Including 14th Conference on Prestigious Applications of Intelligent Systems (PAIS 2025)
IOS Press, 2025.
Добавлено: 26 мая 2026 г.
Comparative Study of Training Methods and Architectures of Echo State Networks
Андросов И. А., Proceedings of the Institute for System Programming of the RAS 2026 Vol. 38 No. 3 P. 87–114
В работе рассматриваются сети эхо-состояний (Echo State Network, ESN), которые являются одними из самых распространенных способов реализации резервуарных вычислений. Они состоят из рекуррентной нейронной сети, веса которой выбираются один раз и не обучаются, и выходного, обычно линейного, обучаемого слоя. Такой подход позволяет создавать энергоэффективные и быстрые нейронные сети, способные обучаться в режиме реального времени. Но ...
Добавлено: 26 мая 2026 г.
Рефакторинг исходного кода на основе LLM и расширения UML
Караваева Е. А., Кулигин Л. А., Резуник Л. и др., Труды Института системного программирования РАН 2026 Т. 38 № 3 С. 67–94
В статье представлен метод рефакторинга исходного кода на основе интеграции большой языковой модели (LLM) и расширенной UML-модели программного кода. Предложенный подход позволяет выявлять проблемные участки кода с использованием функций тревожности и структурных метрик классов, а затем выполнять автоматизированный рефакторинг. Ключевой особенностью метода является использование LLM для генерации формальных спецификаций на языке OCL (Object Constraint Language), ...
Добавлено: 24 мая 2026 г.
Coping with AI errors with provable guarantees
Tyukin I., Тюкина Т. А., van Helden D. P. и др., Information Sciences 2024 Vol. 678 Article 120856
Добавлено: 23 мая 2026 г.
Overcoming the Curse of Dimensionality with Synolitic AI
Zaikin A., Sviridov I., Sosedka A. и др., Technologies 2026 Vol. 14 No. 2 Article 84
Добавлено: 23 мая 2026 г.
Stable On-the-Fly Learning for Dynamic Neural Networks With Delayed Inputs
Chertopolokhov V., Mukhamedov A., Bugriy G. и др., IEEE Access 2026 Vol. 14 P. 14369–14392
Добавлено: 22 мая 2026 г.
Опыт применения сетевого анализа (SNA) в историческом нарративе полисубъектного региона (на примере валлийской хроники Brut y Tywysogyon)
Лошкарева М. Е., Матвеева Н. Н., Вестник Томского государственного университета. История 2026 № 100 С. 112–118
Предпринята попытка применения сетевого анализа в изучении средневекового нарративного источ ника. Цель исследования – проверка гипотезы о политической фрагментарности как основной причины завоевания Уэльса Англией. Построены сети взаимодействий исторических лиц на основе данных валлийской Хроники принцев с 1193 по 1282 г. Построение сетей демонстрирует, что завоевано Англией было формально объеди ненное княжество, ослабляемое не столько ...
Добавлено: 22 мая 2026 г.
Reproducible Benchmark of Wavelet-Enhanced Intrabody Communication Biometric Identification
Джин С., Комаров М. М., Scientific Reports 2026
Добавлено: 21 мая 2026 г.
ML-based Fast Simulation of FARICH Responses
Шипилов Ф. А., Barnyakov A., Ivanov A. и др., / Series Physics "arxiv.org". 2026.
Добавлено: 19 мая 2026 г.
Proceedings of the 19th Conference of the European Chapter of the Association for Computational Linguistics (Volume 3: System Demonstrations)
Rabat: Association for Computational Linguistics, 2026.
Добавлено: 19 мая 2026 г.
Dataset of solubility values for organic compounds in binary mixtures of solvents at various temperatures
Malikov D., Krasnov L., Kiseleva M. и др., Scientific data 2026 Vol. 13 Article 727
Добавлено: 19 мая 2026 г.
Aerokinesis: An IoT-Based Vision-Driven Gesture Control System for Quadcopter Navigation Using Deep Learning and ROS2
Kondratev S., Yulia Dyrchenkova, Georgiy Nikitin и др., Technologies 2026 Vol. 14 No. 1 Article 69
This paper presents Aerokinesis, an IoT-based software–hardware system for intuitive gesture-driven control of quadcopter unmanned aerial vehicles (UAVs), developed within the Robot Operating System 2 (ROS2) framework. The proposed system addresses the challenge of providing an accessible human–drone interaction interface for operators in scenarios where traditional remote controllers are impractical or unavailable. The architecture comprises ...
Добавлено: 19 мая 2026 г.
Aerokinesis: An IoT-Based Vision-Driven Gesture Control System for Quadcopter Navigation Using Deep Learning and ROS2
Kondratev S., Yulia Dyrchenkova, Georgiy Nikitin и др., Technologies 2026 Vol. 14 No. 1 Article 69
This paper presents Aerokinesis, an IoT-based software–hardware system for intuitive gesture-driven control of quadcopter unmanned aerial vehicles (UAVs), developed within the Robot Operating System 2 (ROS2) framework. The proposed system addresses the challenge of providing an accessible human–drone interaction interface for operators in scenarios where traditional remote controllers are impractical or unavailable. The architecture comprises ...
Добавлено: 19 мая 2026 г.
Parallel Computational Technologies. PCT 2025
Springer, 2025.
Добавлено: 18 мая 2026 г.
KMHCR: A Key-Controlled Signal-Domain Transformation for 5G IoT Security
Ronglin Z., Wei L., Jiahong C. и др., Journal of Signal Processing Systems 2026 Vol. 98 Article 31
Добавлено: 16 мая 2026 г.
DPN Verifier: A Toolkit for Faster Soundness Verification and Repair of Process Models with Data
Суворов Н. М., Proceedings of the Institute for System Programming of the RAS 2026 Vol. 38 No. 3(2) P. 49–66
Сети Петри с данными (DPN) являются расширением классических сетей Петри, позволяющим моделировать процессы, где данные влияют на поток управления, обеспечивая комплексное представление о поведении системы и возможность обнаружения точек отказа, которые в противном случае были бы скрыты. Одним из критериев корректности для моделей процессов является бездефектность. Модель процесса называется бездефектной, если она всегда корректно завершается ...
Добавлено: 16 мая 2026 г.
Multimodal graph, surface, and language-based model for protein protein interaction prediction
Артеага Мореано Б. Д., Червов Н. Р., Попцова М. С., Scientific Reports 2026 Vol. 16 No. 1 Article 4772
Добавлено: 4 февраля 2026 г.
Investigating the analytical robustness of the social and behavioural sciences
Aczel B., Szaszi B., Clelland H. и др., Nature 2026 Vol. 652 P. 135–142
Добавлено: 27 января 2026 г.
Screen-Cam Imitation Module for Improving Data Hiding Robustness
Джанашиа К. М., Aleksandr Fedosov, Oleg Evsutin, Sensors 2025 Vol. 25 No. 23 Article 7726
Добавлено: 28 ноября 2025 г.
  • О ВЫШКЕ
  • Цифры и факты
  • Руководство и структура
  • Устойчивое развитие в НИУ ВШЭ
  • Преподаватели и сотрудники
  • Корпуса и общежития
  • Закупки
  • Обращения граждан в НИУ ВШЭ
  • Фонд целевого капитала
  • Противодействие коррупции
  • Сведения о доходах, расходах, об имуществе и обязательствах имущественного характера
  • Сведения об образовательной организации
  • Людям с ограниченными возможностями здоровья
  • Единая платежная страница
  • Работа в Вышке
  • ОБРАЗОВАНИЕ
  • Лицей
  • Довузовская подготовка
  • Олимпиады
  • Прием в бакалавриат
  • Вышка+
  • Прием в магистратуру
  • Аспирантура
  • Дополнительное образование
  • Центр развития карьеры
  • Бизнес-инкубатор ВШЭ
  • Образовательные партнерства
  • Обратная связь и взаимодействие с получателями услуг
  • НАУКА
  • Научные подразделения
  • Исследовательские проекты
  • Мониторинги
  • Диссертационные советы
  • Защиты диссертаций
  • Академическое развитие
  • Конкурсы и гранты
  • Внешние научно-информационные ресурсы
  • РЕСУРСЫ
  • Библиотека
  • Издательский дом ВШЭ
  • Книжный магазин «БукВышка»
  • Типография
  • Медиацентр
  • Журналы ВШЭ
  • Публикации
  • http://www.minobrnauki.gov.ru/
    Министерство науки и высшего образования РФ
  • https://edu.gov.ru/
    Министерство просвещения РФ
  • http://www.edu.ru
    Федеральный портал «Российское образование»
  • https://elearning.hse.ru/mooc
    Массовые открытые онлайн-курсы
  • НИУ ВШЭ1993–2026
  • Адреса и контакты
  • Условия использования материалов
  • Политика конфиденциальности
  • Правила применения рекомендательных технологий в НИУ ВШЭ
  • Карта сайта
Редактору