• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • A
  • A
  • A
  • A
  • A
Обычная версия сайта
  • RU
  • EN
  • Национальный исследовательский университет «Высшая школа экономики»
  • Публикации ВШЭ
  • Статьи
  • Analyzing the Robustness of Vision & Language Models
  • RU
  • EN
Расширенный поиск
Высшая школа экономики
Национальный исследовательский университет
Приоритетные направления
  • бизнес-информатика
  • государственное и муниципальное управление
  • гуманитарные науки
  • инженерные науки
  • компьютерно-математическое
  • математика
  • менеджмент
  • право
  • социология
  • экономика
по году
  • 2027
  • 2026
  • 2025
  • 2024
  • 2023
  • 2022
  • 2021
  • 2020
  • 2019
  • 2018
  • 2017
  • 2016
  • 2015
  • 2014
  • 2013
  • 2012
  • 2011
  • 2010
  • 2009
  • 2008
  • 2007
  • 2006
  • 2005
  • 2004
  • 2003
  • 2002
  • 2001
  • 2000
  • 1999
  • 1998
  • 1997
  • 1996
  • 1995
  • 1994
  • 1993
  • 1992
  • 1991
  • 1990
  • 1989
  • 1988
  • 1987
  • 1986
  • 1985
  • 1984
  • 1983
  • 1982
  • 1981
  • 1980
  • 1979
  • 1978
  • 1977
  • 1976
  • 1975
  • 1974
  • 1973
  • 1972
  • 1971
  • 1970
  • 1969
  • 1968
  • 1967
  • 1966
  • 1965
  • 1964
  • 1963
  • 1958
  • еще
Тематика
Новости
13 мая 2026 г.
Исследователи Вышки - о бездомности, психологии смысла, курении и правах пациентов
В конце апреля в культурном центре Community состоялся третий полуфинал девятого сезона «Научных боев». Четыре исследователя пробирались через импровизированные джунгли социальных проблем, медицинских прав и психологических лабиринтов. У каждого было 10 минут, никаких презентаций — только реквизит, харизма и истории, от которых захватывало дух.
12 мая 2026 г.
Женщины избегают новостей не из-за «второй смены»
Женщины чаще мужчин избегают политических и экономических новостей, однако причины этого поведения связаны не столько со структурным неравенством или семейной нагрузкой, сколько с личными установками и эмоциональным восприятием новостного контента. К такому выводу пришли ученые НИУ ВШЭ, проанализировав данные масштабного опроса более 10 тысяч жителей 61 региона России. Результаты исследования опубликованы в журнале «Женщина в российском обществе».
8 мая 2026 г.
«Все время посвящается работе над диссертацией»
Илья Венедиктов окончил магистратуру Московского института электроники и математики ВШЭ по единому треку «магистратура — аспирантура» и обучается в аспирантской школе ВШЭ по техническим наукам. В настоящее время он проходит длительную стажировку в Китайском университете науки и технологий в городе Хэфэй, занимаясь подготовкой диссертации. Чем стажировка отличается от программы мобильности, какова научная тема Ильи и как проходят будни российского аспиранта в Китае, он рассказал в интервью.

 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!

Публикации
  • Книги
  • Статьи
  • Главы в книгах
  • Препринты
  • Верификация публикаций
  • Расширенный поиск
  • Правила использования материалов
  • Наука в ВШЭ

?

Analyzing the Robustness of Vision & Language Models

IEEE/ACM Transactions on Speech and Language Processing. 2024. Vol. 32. P. 2751–2763.
Ширнин А. А., Andreev N., Potapova S., Артемова Е. Л.

We present an approach to evaluate the robustness of pre-trained vision and language (V&L) models to noise in input data. Given a source image/text, we perturb it using standard computer vision (CV) / natural language processing (NLP) techniques and feed it to a V&L model. To track performance changes, we explore the problem of visual questions answering (VQA). Overall, we utilize 5 image and 9 text perturbation techniques and probe three Transformer-based V&L models followed by a broad analysis of their behavior and a detailed comparison. We discovered several key findings regarding the performance of the models in relation to the impact of various perturbations. These discrepancies in performance can be attributed to differences in their architectures and learning objectives. Last, but not least, we perform an empirical study to assess whether the attention mechanism of V&L Transformers learns to align modalities. We hypothesize, that attention weights for related objects and words, should be on average higher than for random object/word pairs. However, our study shows that, unlike is believed for machine translation models, V&L models do not learn alignment at all or exhibit less evidence to do so. This may support the intuition that V&L Transformers overfit to either of the modalities.

Научное направление: Компьютерные науки
Язык: английский
Полный текст
DOI
Текст на другом сайте
Ключевые слова: computational modelingrobustnessVisualizationData modelsanalytical modelsTask analysisVisual question answeringtransformersAttention MechanismBlack-box InterpretationSpurious Correlations
ПУБЛИКАЦИЯ ПОДГОТОВЛЕНА ПО РЕЗУЛЬТАТАМ ПРОЕКТА:
Модели и методы анализа текстовых данных, рекомендательных систем и майнинга данных (2024)
Похожие публикации
QGKM: A Quantum Fidelity-Based Graph Clustering Framework for Robust Data Pattern Recognition in Education Social Networks QGKM: A Quantum Fidelity-Based Graph Clustering Framework for Robust Data Pattern Recognition in Education Social Networks
Neal N. X., Weiqing L., Dacheng H. и др., Algorithms 2026 Vol. 19 No. 5 P. 1–22
Добавлено: 13 мая 2026 г.
Proceedings of the 9th Student Research Workshop associated with the International Conference Recent Advances in Natural Language Processing
Velichkov B., Nikolova-Koleva I., Slavcheva M., INCOMA Ltd, 2025.
Добавлено: 12 мая 2026 г.
Интегрированная среда моделирования для верификации и валидации программ управления подключенными и высокоавтоматизированными транспортными средствами
Степанянц В. Г., Долгов И. М., Хорошилов Г. С. и др., Труды Института системного программирования РАН 2026 Т. 38 № 3 С. 95–110
На рынок постепенно выходят высокоавтоматизированные и подключенные транспортные средства (ТС). В настоящее время предлагаются решения, позволяющие использовать эти технологии для совместного управления дорожным движением, что может значительно повысить его безопасность. В статье анализируются требования к интегрированной среде моделирования подключенных и высокоавтоматизированных ТС и совместной автоматизации управления дорожным движением с высокодетализированным учетом влияния окружающих объектов. Проанализированы ...
Добавлено: 12 мая 2026 г.
Connected and Automated Vehicle Scenario Manager Graphical User Interface
Тихонов Р. А., Efendiev M. T., Fedotenkov A. A., 2026 International Russian Smart Industry Conference (SmartIndustryCon) 2026 P. 542–547
Добавлено: 11 мая 2026 г.
Proceedings 2026 IEEE 11th International Conference on Smart Cloud SmartCloud 2026 8-10 May 2026
Los Alamitos: IEEE Computer Society, 2026.
Добавлено: 10 мая 2026 г.
От неизвестности к прозрачности: обзор технологий объяснимого ИИ (XAI)
Авдошин С. М., Песоцкая Е. Ю., Информационные технологии 2026 Т. 32 № 4 С. 185–194
С развитием ИИ, и в особенности глубокого обучения, появились модели, способные давать крайне точные прогнозы. Однако их внутренняя логика остается трудной для понимания — и это серьезная проблема, особенно в сферах, где от корректности алгоритма зависят критиче ски важные решения. Одним из перспективных путей ее решения считается направление Explainable Artificial Intelligence (XAI) — разработка подходов, позволяющих прояснять ...
Добавлено: 8 мая 2026 г.
Explainable AI for Industry 5.0: Shedding light on the black box
Авдошин С. М., Песоцкая Е. Ю., Business Informatics 2026 Vol. 20 No. 1 P. 7–28
Добавлено: 8 мая 2026 г.
Comparative Analysis of Students’ Perceptions of Programming Puzzles: Parson’s and Wordle-Like
Варнавский А. Н., IEEE Access 2026 Vol. 14 P. 37487–37508
Добавлено: 7 мая 2026 г.
Towards performance analysis of GPU-aware MPI over Angara interconnect
Ismagilov T., Mukosey A., Смирнов Ф. А. и др., International Journal of High Performance Computing Applications 2026 Vol. 40 No. 2 P. 240–253
Добавлено: 7 мая 2026 г.
Программные инструментальные средства для разработки мероприятий по снижению брака серийного производства
Ясницкий Л. Н., Голдобин М. А., Мезенцев А. С., Прикладная математика и вопросы управления 2025 № 2 С. 99–116
Представлен обзор современных методов и основанных на них программных инструментах, применяемых для математического моделирования серийных производственных процессов с целью снижения брака и повышения качества производимых изделий. Перечисляются группы работ, нацеленных на обнаружение и классификацию дефектов, работ, в которых решаются задачи прогнозирования образования дефектов и определения значимости параметров, работ направленных на поиск оптимального сочетания технологических параметров изготовления изделий, ...
Добавлено: 5 мая 2026 г.
Моделирование и оценка ресурсных затрат алгоритмов маршрутизации в сетях на кристалле с двумерной циркулянтной топологией
Монахова Э. А., Монахов О. Г., Рзаев Э. Р. и др., Прикладная дискретная математика 2026 Т. 71 С. 112–127
В настоящей работе исследовано совместное конструирование топологий семейств оптимальных по диаметру циркулянтных сетей $C(N; \pm 1, \pm s_2)$ и реализуемых для них оптимальных алгоритмов маршрутизации сложности $O(1)$. Предлагаемый алгоритм маршрутизации основан на использовании масштабируемых параметров $L$-образных шаблонов плотной укладки графов на плоскости для семейств оптимальных сетей. Определены аналитические формулы зависимости этих параметров от диаметра графов семейств ...
Добавлено: 4 мая 2026 г.
AlphaDent: A dataset for automated tooth pathology detection
Sosnin E. I., Vasil’ev Y. L., Solovyev R. A. и др., Computer Optics 2025 Vol. 49 No. 6 P. 1129–1137
Добавлено: 4 мая 2026 г.
Мультимодальные модели в медицинской диагностике как универсальный инструмент
Назаренко А. Г., Федоров М. В., Мошкин А. С. и др., Вестник Росздравнадзора 2026 № 1 С. 14–29
Мультимодальные фундаментальные модели и медицинские мультимодальные большие языковые модели формируют новый класс диагностических систем поддержки принятия решений, способных работать с разнородными источниками данных: медицинскими изображениями (рентген, КТ, МРТ, УЗИ, гистология), сигналами (ЭКГ, ЭЭГ), текстом (история болезни, протоколы, выписки), лабораторными показателями, данными молекулярного профилирования и др. В статье систематизированы архитектуры и стратегии обучения, обеспечивающие переносимость между ...
Добавлено: 4 мая 2026 г.
2025 IEEE/CVF International Conference on Computer Vision Workshops (ICCVW)
Honolulu: IEEE, 2025.
Добавлено: 3 мая 2026 г.
MinMAE calibration method for convolutional neural network quantization
Vasilev A., Kapitanov A., Solovyev Roman A. и др., PeerJ Computer Science 2026 Vol. 12 Article 3724
Добавлено: 3 мая 2026 г.
Machine Learning Methods for Fast Evaluation of Static IR Drop Effect
Solovyev Roman A., Telpukhov Dmitry, Shafeev I. и др., Technologies 2026 Vol. 14 No. 3 Article 169
Добавлено: 3 мая 2026 г.
On the minimum number of maximal distance-k independent sets in trees
Талецкий Д. С., / Series arXiv "math". 2026.
Добавлено: 1 мая 2026 г.
Proceedings of the 2026 8th International Youth Conference on Radio Electronics, Electrical and Power Engineering (REEPE)
Даюб А., Сулейман Э., IEEE, 2026.
Добавлено: 30 апреля 2026 г.
Интеллектуальный анализ данных в нефтегазовой отрасли
М.: ООО «Геомодель Развитие», 2024.
Интелшектуальный анализ данных в нефтегазовой отрасли, Калининград, Россия, 2024, ООО «Геомодель Развитие» ...
Добавлено: 29 апреля 2026 г.
Bioinspired Method of Agent Redistribution between Groups
Karpova Irina Petrovna, Pattern Recognition and Image Analysis 2025 Vol. 35 No. 4 P. 1138–1144
Добавлено: 29 апреля 2026 г.
Multimodal graph, surface, and language-based model for protein protein interaction prediction
Артеага Мореано Б. Д., Червов Н. Р., Попцова М. С., Scientific Reports 2026 Vol. 16 No. 1 Article 4772
Добавлено: 4 февраля 2026 г.
Investigating the analytical robustness of the social and behavioural sciences
Aczel B., Szaszi B., Clelland H. и др., Nature 2026 Vol. 652 P. 135–142
Добавлено: 27 января 2026 г.
Screen-Cam Imitation Module for Improving Data Hiding Robustness
Джанашиа К. М., Aleksandr Fedosov, Oleg Evsutin, Sensors 2025 Vol. 25 No. 23 Article 7726
Добавлено: 28 ноября 2025 г.
Dynamic Robustification of Trading Management Strategies for Unstable Immersion Environments
Musaev A., Makshanov A., Dmitry Grigoriev, Montenegrin Journal of Economics 2023 Vol. 19 No. 1 P. 19–30
Добавлено: 11 июля 2025 г.
  • О ВЫШКЕ
  • Цифры и факты
  • Руководство и структура
  • Устойчивое развитие в НИУ ВШЭ
  • Преподаватели и сотрудники
  • Корпуса и общежития
  • Закупки
  • Обращения граждан в НИУ ВШЭ
  • Фонд целевого капитала
  • Противодействие коррупции
  • Сведения о доходах, расходах, об имуществе и обязательствах имущественного характера
  • Сведения об образовательной организации
  • Людям с ограниченными возможностями здоровья
  • Единая платежная страница
  • Работа в Вышке
  • ОБРАЗОВАНИЕ
  • Лицей
  • Довузовская подготовка
  • Олимпиады
  • Прием в бакалавриат
  • Вышка+
  • Прием в магистратуру
  • Аспирантура
  • Дополнительное образование
  • Центр развития карьеры
  • Бизнес-инкубатор ВШЭ
  • Образовательные партнерства
  • Обратная связь и взаимодействие с получателями услуг
  • НАУКА
  • Научные подразделения
  • Исследовательские проекты
  • Мониторинги
  • Диссертационные советы
  • Защиты диссертаций
  • Академическое развитие
  • Конкурсы и гранты
  • Внешние научно-информационные ресурсы
  • РЕСУРСЫ
  • Библиотека
  • Издательский дом ВШЭ
  • Книжный магазин «БукВышка»
  • Типография
  • Медиацентр
  • Журналы ВШЭ
  • Публикации
  • http://www.minobrnauki.gov.ru/
    Министерство науки и высшего образования РФ
  • https://edu.gov.ru/
    Министерство просвещения РФ
  • http://www.edu.ru
    Федеральный портал «Российское образование»
  • https://elearning.hse.ru/mooc
    Массовые открытые онлайн-курсы
  • НИУ ВШЭ1993–2026
  • Адреса и контакты
  • Условия использования материалов
  • Политика конфиденциальности
  • Правила применения рекомендательных технологий в НИУ ВШЭ
  • Карта сайта
Редактору