• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • A
  • A
  • A
  • A
  • A
Обычная версия сайта
  • RU
  • EN
  • Национальный исследовательский университет «Высшая школа экономики»
  • Публикации ВШЭ
  • Статьи
  • Анализ влияния обфускации входных данных на эффективность языковых моделей в обнаружении инъекции подсказок
  • RU
  • EN
Расширенный поиск
Высшая школа экономики
Национальный исследовательский университет
Приоритетные направления
  • бизнес-информатика
  • государственное и муниципальное управление
  • гуманитарные науки
  • инженерные науки
  • компьютерно-математическое
  • математика
  • менеджмент
  • право
  • социология
  • экономика
по году
  • 2027
  • 2026
  • 2025
  • 2024
  • 2023
  • 2022
  • 2021
  • 2020
  • 2019
  • 2018
  • 2017
  • 2016
  • 2015
  • 2014
  • 2013
  • 2012
  • 2011
  • 2010
  • 2009
  • 2008
  • 2007
  • 2006
  • 2005
  • 2004
  • 2003
  • 2002
  • 2001
  • 2000
  • 1999
  • 1998
  • 1997
  • 1996
  • 1995
  • 1994
  • 1993
  • 1992
  • 1991
  • 1990
  • 1989
  • 1988
  • 1987
  • 1986
  • 1985
  • 1984
  • 1983
  • 1982
  • 1981
  • 1980
  • 1979
  • 1978
  • 1977
  • 1976
  • 1975
  • 1974
  • 1973
  • 1972
  • 1971
  • 1970
  • 1969
  • 1968
  • 1967
  • 1966
  • 1965
  • 1964
  • 1963
  • 1958
  • еще
Тематика
Новости
30 апреля 2026 г.
«Моя цель - стать ординарным профессором»
Михаил Саматов занимается теоретическими исследованиями перовскитных солнечных батарей. В интервью проекту «Молодые ученые Вышки» он рассказал о работе на суперкомпьютере Вышки, сотрудничестве с Пекинским университетом и умении делать мебель.
29 апреля 2026 г.
Научить машину читать прошлое: на ФГН создают нейросеть для расшифровки рукописей
Дневники и письма — бесценный источник для гуманитария-исследователя. Но что делать, если текст невозможно прочитать? На факультете гуманитарных наук (ФГН) ВШЭ эту проблему решили перевести на язык математики: команда филологов, историков и специалистов по машинному обучению создала информационную систему, которая не только распознает неразборчивый почерк, но и помогает анализировать содержание архивов.
29 апреля 2026 г.
8 драйверов технологического будущего: что изменит экономику
Какие отрасли определят облик ближайших десятилетий? Премьер-министр  Михаил Мишустин назвал 8 направлений, которые будут развиваться в ближайшие годы. О том, какие образовательные программы НИУ ВШЭ готовят специалистов по этим направлениям — в материале IQ медиа.

 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!

Публикации
  • Книги
  • Статьи
  • Главы в книгах
  • Препринты
  • Верификация публикаций
  • Расширенный поиск
  • Правила использования материалов
  • Наука в ВШЭ

?

Анализ влияния обфускации входных данных на эффективность языковых моделей в обнаружении инъекции подсказок

Программные системы и вычислительные методы. 2025. № 2.
Крохин А. С., Гусев М. М.

В статье рассматривается проблема обфускации промптов как способа обхода защитных механизмов в больших языковых моделях (LLM), предназначенных для обнаружения промпт-инъекций. Промпт-инъекции представляют собой метод атаки, при котором злоумышленники манипулируют входными данными, чтобы изменить поведение модели и заставить её выполнять нежелательные или вредоносные действия. Обфускация включает в себя различные методы изменения структуры и содержания текста, такие как замена слов синонимами, перемешивание букв в словах, вставка случайных символов и другие. Цель обфускации — затруднить анализ и классификацию текста, чтобы обойти фильтры и защитные механизмы, встроенные в языковые модели. В рамках исследования проводится анализ эффективности различных методов обфускации в обходе моделей, обученных на задачу классификации текста. Особое внимание уделяется оценке потенциальных последствий обфускации для безопасности и защиты данных. В исследовании используются различные методы обфускации текстов, которые применяются к промптам из датасета AdvBench. Эффективность методов оценивается на примере трёх моделей-классификаторов, обученных на задачу обнаружения промпт-инъекций. Научная новизна исследования заключается в анализе влияния обфускации промптов на эффективность языковых моделей в обнаружении промпт-инъекций. В ходе работы выявлено, что применение сложных методов обфускации увеличивает долю запросов, классифицируемых как инъекции, что подчёркивает необходимость тщательного подхода к тестированию безопасности больших языковых моделей. Выводы исследования указывают на важность баланса между сложностью метода обфускации и его эффективностью в контексте атак на модели. Чрезмерно сложные методы обфускации могут повысить вероятность обнаружения инъекций, что требует дальнейшего изучения для оптимизации подходов к обеспечению безопасности языковых моделей. Результаты работы подчёркивают необходимость постоянного совершенствования защитных механизмов и разработки новых методов обнаружения и предотвращения атак на большие языковые модели.

Научное направление: Компьютерные науки
Язык: русский
Полный текст
DOI
Текст на другом сайте
Ключевые слова: искусственный интеллектЭнкодерencoderобфускацияobfuscationсостязательные атакиfuzzingфаззингтрансформерыadversarial attackбольшие языковые моделиgenerative pre-trained transformers (GPT)Model JailbreakArtificial intelligence; Generative AI; LLM; HR-automationБезопасность искусственного интеллектаprompt injectionAI Securityинъекция подсказокджейлбрейк
Похожие публикации
On the minimum number of maximal distance-k independent sets in trees
Талецкий Д. С., / Series arXiv "math". 2026.
Добавлено: 1 мая 2026 г.
Proceedings of the 2026 8th International Youth Conference on Radio Electronics, Electrical and Power Engineering (REEPE)
Даюб А., Сулейман Э., IEEE, 2026.
Добавлено: 30 апреля 2026 г.
Интеллектуальный анализ данных в нефтегазовой отрасли
М.: ООО «Геомодель Развитие», 2024.
Интелшектуальный анализ данных в нефтегазовой отрасли, Калининград, Россия, 2024, ООО «Геомодель Развитие» ...
Добавлено: 29 апреля 2026 г.
Bioinspired Method of Agent Redistribution between Groups
Karpova Irina Petrovna, Pattern Recognition and Image Analysis 2025 Vol. 35 No. 4 P. 1138–1144
Добавлено: 29 апреля 2026 г.
Правовой режим объектов, созданных искусственным интеллектом: обзор зарубежной практики
Кирсанова Е. Е., Пакшин П. К., Право и экономика 2026 № 3 (456) С. 26–34
В статье рассматривается вопрос правового режима интеллектуальной собственности, созданной искусственным интеллектом. Изменения существующей правовой базы в сторону признания искусственного интеллекта субъектом права нарушат обоснование и фундаментальные принципы системы интеллектуальных прав. В статье представлен обзор разных взглядов на обоснование предоставления авторских прав на созданные искусственным интеллектом произведения. Автор отмечает, что в некоторых юрисдикциях авторские права таким ...
Добавлено: 28 апреля 2026 г.
Natural hazard database from Internet publications: text mining with a large language model
Деркачева А. А., Сакиркина М. А., Краев Г. Н. и др., /. 2026.
Добавлено: 28 апреля 2026 г.
Influence of the Normal Magnetic Component to Magnetotail Current Sheet Forma
Domrin V. I., Malova H. V., V. Yu. Popov и др., Cosmic Research 2026 Vol. 64 No. 2 P. 238–252
Добавлено: 27 апреля 2026 г.
Asymmetric Equilibrium Structures of Superthin Current Sheets: The Asymmetry of Plasma Sources
Tsareva O. O., Malova H. V., V. Yu. Popov и др., Plasma Physics Reports 2026 Vol. 52 No. 2 P. 179–185
Добавлено: 27 апреля 2026 г.
WWW '26: The ACM Web Conference 2026
NY: Association for Computing Machinery (ACM), 2026.
Добавлено: 23 апреля 2026 г.
Разработка микросервиса ADP для идентификации источников выбросов на основе машинного обучения с подкреплением
Кычкин А. В., Черницин И. А., Прикладная информатика 2026 Т. 21 № 1 С. 40–58
Представлены результаты разработки программного микросервиса, встраиваемого в системы мониторинга качества атмосферного воздуха для поддержки процессов идентификации промышленных источников загрязнений. Выброс и последующее распространение вредных веществ в приземистых слоях атмосферы происходит в динамике и характеризуется высокой неопределенностью из‑за особенностей технологических установок, их режимов работы, влияния рельефа местности, зданий и метеофакторов. Зависимости между местоположением источника выброса и ...
Добавлено: 23 апреля 2026 г.
Практики использования технологии дипфейк в современных аудиовизуальных медиа: этические рестрикции
Ефанов А. А., Человек 2026 Т. 37 № 2 С. 67–82
В статье посредством обращения к наиболее резонансным кейсам представляются практики использования технологии дипфейк в современных аудиовизуальных медиа (телевидение, кино, интернет). На базе результатов проведенных автором полуструктурированных интервью экспертов (n = 15) – аналитиков медиакоммуникаций, а также с помощью методов кейс-стади и социокультурного моделирования выявляются этические рестрикции подобных аудиовизуальных решений. Теоретико-методологическая основа исследования опирается на концепцию ...
Добавлено: 23 апреля 2026 г.
Об идеологических предвзятостях генеративного ИИ: Российско-украинский конфликт в репрезентации ChatGPT
Байша О. А., Трофимов В. В., Российская школа связей с общественностью 2026 № 40 С. 171–191
Все большее количество ученых предупреждает об опасности воспроизведения генеративным ИИ социально-политических и идеологических предрассудков, впитанных моделями из текстов, на которых они обучались. Если, например, та или иная модель тренировалась на материалах западных СМИ, она может генерировать нарративы, воспроизводящие западноцентричный взгляд на мировые события. Это проявляется в репродукции определений глобальных проблем, нормализированных в западных гегемонистских дискурсах. ...
Добавлено: 21 апреля 2026 г.
2026 International Conference on Artificial Intelligence, Computer, Data Sciences and Applications (ACDSA)
IEEE, 2026.
Добавлено: 21 апреля 2026 г.
Влияние искусственного интеллекта на профессиональную деятельность фрилансеров
Стребков Д. О., Социологические исследования 2026 № 2 С. 35–47
В статье анализируется влияние искусственного интеллекта на профессиональную деятельность русскоязычных фрилансеров, занятых в творческих и интеллектуальных сферах деятельности. Опираясь на данные онлайн-опросов, проведенных в 2024 и 2025 г. на платформе Freelance.ru, исследование выявляет динамику использования ИИ, основные задачи, которые доверяются нейросетям, а также преимущества и ограничения их применения. Показано, что за год существенно выросла доля людей, ...
Добавлено: 20 апреля 2026 г.
What Drives Multi-Chain Crypto Forecasting: Model Choice, Feature Selection, and Transferability
Wang M., Xiao Y., Браславский П. И. и др., Mathematics 2026 Vol. 14 No. 8 Article 1286
Добавлено: 20 апреля 2026 г.
Cross-influence of two societies in deterministic evolutionary game
Щур Л. Н., Antonov D., Burovski E., International Journal of Bifurcation and Chaos in Applied Sciences and Engineering 2026 P. 1–9
Добавлено: 20 апреля 2026 г.
Проектирование сети Интернета вещей на основе многокритериальной оптимизации и информационного моделирования здания
Эбрахим А., Информационные процессы 2025 Т. 25 № 4 С. 787–798
В статье предложен метод планирования расположения точек доступа и шлюзов внутри зданий для построения сетей Интернета вещей. Основа метода — использование информации из информационой модели здания, что даёт возможность легко учитывать как геометрию, так и физико-технические характеристики строительных элементов при расчёте распространения радиосигнала. В данной работе для решения задач оптимизации применяется генетический алгоритм U-NSGA-III. Расчёты ...
Добавлено: 19 апреля 2026 г.
Modeling cosolvent effects on solubility in supercritical CO2 using data-driven approaches
Makarov D. M., Каликин Н. Н., Gurikov P. и др., Journal of Supercritical Fluids 2026 Vol. 235 Article 106979
Добавлено: 19 апреля 2026 г.
2026 28th International Conference on Digital Signal Processing and its Applications (DSPA)
IEEE, 2026.
Добавлено: 18 апреля 2026 г.
Нейросетевые инструменты в арсенале вузовского преподавателя
Федоров А. О., Вакку Г. В., Лебедева С. Э., Галактика медиа: журнал медиа исследований 2026 Т. 8 № 2 С. 163–182
С увеличением объемов данных преподаватель вуза может потратить годы на обработку и  систематизацию информации. Персонализированная помощь, рекомендации по контенту, сбор данных для обзоров литературы и оформление библиографических ссылок укрепляют роль искусственного интеллекта как эффективного нейросетевого инструмента научной коммуникации. В данной статье рассматриваются практические примеры использования таких инструментов, как Elicit, SciSpace, Consensus, Undermind и Paperfinder, для упрощения ...
Добавлено: 7 апреля 2026 г.
Институт аналогии в информационном праве России
Лескина Э. И., Вестник Воронежского государственного университета. Серия: Право 2025 № 4(63) С. 157–165
Скорость развития и распространения цифровых технологий с каждым годом лишь увеличивается, как и расширяются сферы их применение. Системы искусственного интеллекта решают задачи творческого характера, предиктивная аналитика применяется в правоохранительных органах, не остаются без внимания такие области, как здравоохранение, транспорт, образование и многие другие сферы. Часть общественных отношений при этом нуждается в принятии необходимых правовых норм, ...
Добавлено: 1 апреля 2026 г.
Large Language Models as Political Actors: Cultural Bias and Epistemic Power
Seredkina E., Seletkova G., Михайловский А. В., Technology and Language 2026 Vol. 7 No. 1 P. 63–79
Быстрое распространение больших языковых моделей (Large Language Models, LLM) в социально и политически чувствительных сферах ставит вопрос о природе и источниках политической предвзятости в системах искусственного интеллекта. В большинстве исследований предвзятость рассматривается преимущественно как технический дефект, подлежащий устранению. Здесь предлагается более широкая философская и культурная интерпретация феномена, согласно которой предвзятость LLM является результатом встроенных эпистемических ...
Добавлено: 1 апреля 2026 г.
Replacing Criterion of Creativity with Criterion of Investment for Results Created by Artificial Intelligence
Пакшин П. К., Legal Issues in the Digital Age 2026 Vol. 7 No. 1 P. 32–48
Искусственный интеллект выполняет значимую функцию в процессе автоматизации, минимизируя операционное участие человека в таких сферах, как медицина, искусство и юриспруденция. Несмотря на исторически тесную взаимосвязь искусства и технологий, именно генеративный искусственный интеллект расширил потенциал для творческой деятельности. Существенным катализатором этого процесса стало распространение предобученных систем искусственного интеллекта, интенсифицировавших развитие технологий в области обработки естественного языка ...
Добавлено: 31 марта 2026 г.
ARTIFICIAL INTELIGENCE FOR INCLUSION: A PUBLIC BRICS FINANCIAL AI PLATFORM
Юдина М. А., Ярыгина И., Четти К. и др., Finance: Theory and Practice 2026 Vol. 30 No. 1 P. 103–119
В статье представлен результат всестороннего исследования потенциала стран БРИКС в области применения искусственного интеллекта (ИИ) для создания общей финансовой платформы. Предметом исследования является искусственный интеллект как фактор расширения сотрудничества стран БРИКС в финансовой сфере. Основываясь на методологической комбинации структурированных подходов, включающих, в частности, элементы метода PRISMA, определена цель исследования, направленная на разработку мер, стимулирующих внедрение ...
Добавлено: 31 марта 2026 г.
  • О ВЫШКЕ
  • Цифры и факты
  • Руководство и структура
  • Устойчивое развитие в НИУ ВШЭ
  • Преподаватели и сотрудники
  • Корпуса и общежития
  • Закупки
  • Обращения граждан в НИУ ВШЭ
  • Фонд целевого капитала
  • Противодействие коррупции
  • Сведения о доходах, расходах, об имуществе и обязательствах имущественного характера
  • Сведения об образовательной организации
  • Людям с ограниченными возможностями здоровья
  • Единая платежная страница
  • Работа в Вышке
  • ОБРАЗОВАНИЕ
  • Лицей
  • Довузовская подготовка
  • Олимпиады
  • Прием в бакалавриат
  • Вышка+
  • Прием в магистратуру
  • Аспирантура
  • Дополнительное образование
  • Центр развития карьеры
  • Бизнес-инкубатор ВШЭ
  • Образовательные партнерства
  • Обратная связь и взаимодействие с получателями услуг
  • НАУКА
  • Научные подразделения
  • Исследовательские проекты
  • Мониторинги
  • Диссертационные советы
  • Защиты диссертаций
  • Академическое развитие
  • Конкурсы и гранты
  • Внешние научно-информационные ресурсы
  • РЕСУРСЫ
  • Библиотека
  • Издательский дом ВШЭ
  • Книжный магазин «БукВышка»
  • Типография
  • Медиацентр
  • Журналы ВШЭ
  • Публикации
  • http://www.minobrnauki.gov.ru/
    Министерство науки и высшего образования РФ
  • https://edu.gov.ru/
    Министерство просвещения РФ
  • http://www.edu.ru
    Федеральный портал «Российское образование»
  • https://elearning.hse.ru/mooc
    Массовые открытые онлайн-курсы
  • НИУ ВШЭ1993–2026
  • Адреса и контакты
  • Условия использования материалов
  • Политика конфиденциальности
  • Правила применения рекомендательных технологий в НИУ ВШЭ
  • Карта сайта
Редактору