• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • A
  • A
  • A
  • A
  • A
Обычная версия сайта
  • RU
  • EN
  • Национальный исследовательский университет «Высшая школа экономики»
  • Публикации ВШЭ
  • Статьи
  • UVIP: Model-Free Approach to Evaluate Reinforcement Learning Algorithms
  • RU
  • EN
Расширенный поиск
Высшая школа экономики
Национальный исследовательский университет
Приоритетные направления
  • бизнес-информатика
  • государственное и муниципальное управление
  • гуманитарные науки
  • инженерные науки
  • компьютерно-математическое
  • математика
  • менеджмент
  • право
  • социология
  • экономика
по году
  • 2027
  • 2026
  • 2025
  • 2024
  • 2023
  • 2022
  • 2021
  • 2020
  • 2019
  • 2018
  • 2017
  • 2016
  • 2015
  • 2014
  • 2013
  • 2012
  • 2011
  • 2010
  • 2009
  • 2008
  • 2007
  • 2006
  • 2005
  • 2004
  • 2003
  • 2002
  • 2001
  • 2000
  • 1999
  • 1998
  • 1997
  • 1996
  • 1995
  • 1994
  • 1993
  • 1992
  • 1991
  • 1990
  • 1989
  • 1988
  • 1987
  • 1986
  • 1985
  • 1984
  • 1983
  • 1982
  • 1981
  • 1980
  • 1979
  • 1978
  • 1977
  • 1976
  • 1975
  • 1974
  • 1973
  • 1972
  • 1971
  • 1970
  • 1969
  • 1968
  • 1967
  • 1966
  • 1965
  • 1964
  • 1963
  • 1958
  • еще
Тематика
Новости
16 июня 2026 г.
Публичность ученого: идеальная мера
Еще недавно публичность для ученого считалась чем-то факультативным – полезным, но необязательным. Сегодня она все чаще встроена в научную работу. Не потому, что «надо быть в медиа», а потому что без внешней проявленности исследования могут просто не найти ни аудитории, ни партнеров, ни продолжения. Об этом в статье для IQ Media размышляет эксперт по научным коммуникациям, доцент факультета географии Высшей школы экономики Надежда Пупышева.
15 июня 2026 г.
Ученые ВШЭ выяснили, кто чаще проверяет информацию в интернете
Исследователи НИУ ВШЭ выяснили, как российские интернет-пользователи проверяют сомнительную информацию и что заставляет их это делать. Оказалось, что более половины, заподозрив обман, пытаются отыскать первоисточник. А определяющими факторами в деле проверки становятся возраст, место жительства, социальное положение, навыки работы с информацией и использование ИИ. Результаты опубликованы в журнале «Мониторинг общественного мнения: экономические и социальные перемены».
15 июня 2026 г.
<a>Институт робототехнических систем ВШЭ запустил научно-технический семинар
Институт робототехнических систем (ИРС) ВШЭ запустил новый ежемесячный формат — Научно-технический семинар. Он объединяет сотрудников института, приглашенных экспертов, студентов, исследователей и представителей других подразделений НИУ ВШЭ для обсуждения актуальных задач мехатроники, робототехники и киберфизических систем.

 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!

Публикации
  • Книги
  • Статьи
  • Главы в книгах
  • Препринты
  • Верификация публикаций
  • Расширенный поиск
  • Правила использования материалов
  • Наука в ВШЭ

?

UVIP: Model-Free Approach to Evaluate Reinforcement Learning Algorithms

Journal of Optimization Theory and Applications. 2026. Vol. 208. Article 89.
Беломестный Д. В., Левин И. В., Наумов А. А., Самсонов С. В.
Научное направление: Компьютерные науки
Язык: английский
Полный текст
DOI
Текст на другом сайте
Ключевые слова: policy evaluationpolicy errorconfidence intervals for optimal value functionReinforcement learningModel-free Algorithm
Похожие публикации
Proceedings of the 19th Conference of the European Chapter of the Association for Computational Linguistics (Volume 1: Long Papers)
Association for Computational Linguistics, 2026.
Добавлено: 14 июня 2026 г.
Proceedings of the 6th Workshop on Computational Approaches to Discourse, Context and Document-Level Inferences (CODI 2025)
Strube M., Braud C., Hardmeier C. и др., Suzhou: Association for Computational Linguistics, 2025.
Добавлено: 11 июня 2026 г.
TreeDQN: Sample-efficient off-policy reinforcement learning for combinatorial optimization
Sorokin D., Kostin A., Савченко Л. В. и др., Knowledge-Based Systems 2026 Vol. 348 Article 116258
Добавлено: 10 июня 2026 г.
Microbial diversity and production of milk spirit using traditional Buryat fermentation and distillation technologies
Namsaraev Z., Nanzatov B., Козлова А. Д. и др., Scientific Reports 2026 Vol. 16 No. 1 Article 17769
Дистиллированные кисломолочные напитки встречаются в пищевой промышленности редко, несмотря на повсеместное распространение растительных спиртных напитков. В настоящее время производство крепких дистиллированных алкогольных напитков из кисломолочных продуктов с использованием традиционных технологий известно лишь среди монголоязычных народов и их сибирских соседей. Данное исследование представляет собой первый междисциплинарный анализ дарасуна, традиционного бурятского спиртного напитка, изготавливаемого из кисломолочного напитка ...
Добавлено: 10 июня 2026 г.
Artificial intelligence and digital twins for failure prediction in data center cooling systems: a comprehensive literature review (2018–2026)
Butorova A., Bobakov V., Sergeev A. и др., European Physical Journal: Special Topics 2026 P. 1–19
Добавлено: 10 июня 2026 г.
Innovations in Information and Decision Sciences. Proceedings of the 13th International Conference on Frontiers in Intelligent Computing: Theory and Applications (FICTA 2025), Volume 4
Springer, 2026.
Добавлено: 8 июня 2026 г.
Proceedings of the 43rd International Conference on Machine Learning (ICML 2026)
Seul: PMLR, 2026.
Добавлено: 4 июня 2026 г.
OpenAtom Foundation. Консорциум, развивающий Open Source в Китае.
Силаков Д. В., Системный администратор 2026 № 3 С. 28–33
В статье про платформы для разработки открытого ПО в Китае мы рассказали про GitCode – молодой проект, позиционируемый как площадка для разработчиков со всего мира. Сейчас на GitCode размещаются проекты, созданные в КНР, но некоторые из них уже известны и на международной арене. Помочь открытым проектам в становлении, развитии и расширению аудитории призван фонд OpenAtom ...
Добавлено: 2 июня 2026 г.
The recognition-by-components method
Slivnitsin P., Мыльников Л. А., Engineering Applications of Artificial Intelligence 2026 Vol. 179 Article 115185
Добавлено: 29 мая 2026 г.
Brain-Computer Interfaces for Gait Rehabilitation After Stroke A Scoping Review
Мокиенко О. А., Zisman M. A., Бобров П. Д. и др., American Journal of Physical Medicine and Rehabilitation 2026 Vol. 105 No. 6 P. 555–563
Добавлено: 28 мая 2026 г.
Generalizing the Brady-Yong Algorithm: Efficient Fast Hough Transform for Arbitrary Image Sizes
Kazimirov D., Rybakova E., Vitalii V. Gulevskii и др., IEEE Access 2025 Vol. 13 P. 20101–20132
Добавлено: 28 мая 2026 г.
Russia on the Path Towards a New Technology Industrial Policy: Exciting Prospects and Fatal Traps
Симачев Ю. В., Кузык М. Г., Кузнецов Б. В. и др., Foresight and STI Governance 2014 Vol. 8 No. 4 P. 6–23
Добавлено: 22 октября 2025 г.
Impact of self-learning based high-frequency traders on the stock market
Mansurov K., Semenov A., Dmitry Grigoriev и др., Expert Systems with Applications 2023 Vol. 232 Article 120567
Добавлено: 11 июля 2025 г.
Cryptocurrency Exchange Simulation
Mansurov K., Semenov A., Dmitry Grigoriev и др., Computational Economics 2024 Vol. 64 P. 2585–2603
Добавлено: 11 июля 2025 г.
Исследование делового климата в российской науке: апробация подхода
Гершман М. А., Гохберг Л. М., Кузнецова Т. Е., Вопросы экономики 2025 № 6 С. 114–136
Представлены новаторский подход к оценке ситуации (делового климата) в сфере науки и технологий, а также краткие результаты его апробации в ходе трех масштабных опросов руководителей научных организаций и вузов, проведенных в 2017, 2022 и 2024 гг. Методология основана на теории и практике количественных, в том числе статистических, измерений этой сферы, проведения конъюнктурных обследований организаций, оценки ...
Добавлено: 14 июня 2025 г.
Doing science an approach to a comprehensive assessment of the business climate for science and technology
Гохберг Л. М., Майснер Д., Гершман М. А. и др., Technology in Society 2025 Vol. 82 Article 102948
Добавлено: 10 июня 2025 г.
Изменения в здоровом образе жизни в период пандемии COVID-19 и государственная политика: систематический обзор исследований
Засимова Л. С., Колосницына М. Г., Коссова Т. В. и др., Электронный научный журнал "Социальные аспекты здоровья населения" 2024 Т. 70 № 2 Статья 12
Актуальность. Пандемия COVID-19 и противоэпидемические меры государственной политики существенно повлияли на образ жизни людей. Во многих странах самоизоляция, локдауны, выплаты пособий для поддержки населения вводились на фоне уже действующих и новых мер стимулирования здорового образа жизни. Их эффекты (часто разнонаправленные) накладывались друг на друга, затрудняя исследование влияния каждой из мер на поведение людей. Цель исследования. Провести систематический обзор ...
Добавлено: 10 июня 2024 г.
Do Counter-sanctions in Agriculture Promote Growth? Evidence from Russia
Котырло Е. С., Зайцев А. А., Applied Economics 2024 Vol. 56 No. 56 P. 7563–7574
Добавлено: 6 декабря 2023 г.
Disentangling the impact of mean reversion in estimating policy response with dynamic panels
Бесстремянная Г. Е., Golovan S., Dependence Modeling 2022 Vol. 10 No. 1 P. 58–86
Добавлено: 25 октября 2022 г.
Долгосрочный тренд снижения занятости в российском сельском хозяйстве и политика контрсанкций: был ли эффект?
Котырло Е. С., Никулина Ю. Н., Зайцев А. А., Экономический журнал Высшей школы экономики 2021 Т. 25 № 4 С. 515–539
С 2014 года в России в рамках политики контрсанкций действует эмбарго, ограничившее часть продовольственного импорта и создавшее более благоприятные условия для развития сельского хозяйства. В 2015–2018 гг. занятость в сельском хозяйстве стабилизировалась на фоне непрерывного падения в течение последних десятилетий. Закономерно возникает предположение о благоприятном влиянии контрсанкций на динамику занятости в отрасли. Для проверки этой ...
Добавлено: 10 января 2022 г.
Удалось ли реформам здравоохранения в России уменьшить очередь к врачу?
Заздравных Е. А., Тараскина Е. В., Экономическая политика 2021 Т. 16 № 5 С. 118–143
Очереди к врачу являются серьезной проблемой государственной системы здравоохранения России в течение длительного времени. Уже десять лет принимаются меры по сокращению затрат времени на ожидание медицинской помощи. В статье предпринята попытка оценить динамику среднего времени на ожидание врачебной помощи в период 2011–2018 годов и взаимосвязь этого показателя с социально-экономическим статусом россиян. В случае если время ...
Добавлено: 8 ноября 2021 г.
Fertility, Childcare and Labour Market: Dynamics in Time and Space
Котырло Е. С., Wikström M., Hanes N., Umeå University, 2021.
Добавлено: 1 ноября 2021 г.
The causal impact of performance-based funding on university performance: quasi-experimental evidence from a policy in Russian higher education
Agasisti T., Абалмасова Е. С., Шибанова Е. Ю. и др., Oxford Economic Papers 2022 Vol. 74 No. 4 P. 1021–1044
Добавлено: 1 сентября 2021 г.
UVIP: Model-Free Approach to Evaluate Reinforcement Learning Algorithms
Беломестный Д. В., Левин И. В., Мулине Э. Ф. и др., Working papers by Cornell University. Series math "arxiv.org" 2021 Article 2105.02135
Policy evaluation  is an important instrument  for the comparison of different algorithms in Reinforcement Learning (RL). Yet even a precise knowledge of the value function $V^{\pi}$ corresponding to a policy $\pi$ does not provide reliable information on how far is the  policy $\pi$ from the optimal one. We present a novel model-free upper value iteration ...
Добавлено: 3 июня 2021 г.
  • О ВЫШКЕ
  • Цифры и факты
  • Руководство и структура
  • Устойчивое развитие в НИУ ВШЭ
  • Преподаватели и сотрудники
  • Корпуса и общежития
  • Закупки
  • Обращения граждан в НИУ ВШЭ
  • Фонд целевого капитала
  • Противодействие коррупции
  • Сведения о доходах, расходах, об имуществе и обязательствах имущественного характера
  • Сведения об образовательной организации
  • Людям с ограниченными возможностями здоровья
  • Единая платежная страница
  • Работа в Вышке
  • ОБРАЗОВАНИЕ
  • Лицей
  • Довузовская подготовка
  • Олимпиады
  • Прием в бакалавриат
  • Вышка+
  • Прием в магистратуру
  • Аспирантура
  • Дополнительное образование
  • Центр развития карьеры
  • Бизнес-инкубатор ВШЭ
  • Образовательные партнерства
  • Обратная связь и взаимодействие с получателями услуг
  • НАУКА
  • Научные подразделения
  • Исследовательские проекты
  • Мониторинги
  • Диссертационные советы
  • Защиты диссертаций
  • Академическое развитие
  • Конкурсы и гранты
  • Внешние научно-информационные ресурсы
  • РЕСУРСЫ
  • Библиотека
  • Издательский дом ВШЭ
  • Книжный магазин «БукВышка»
  • Типография
  • Медиацентр
  • Журналы ВШЭ
  • Публикации
  • http://www.minobrnauki.gov.ru/
    Министерство науки и высшего образования РФ
  • https://edu.gov.ru/
    Министерство просвещения РФ
  • http://www.edu.ru
    Федеральный портал «Российское образование»
  • https://elearning.hse.ru/mooc
    Массовые открытые онлайн-курсы
  • НИУ ВШЭ1993–2026
  • Адреса и контакты
  • Условия использования материалов
  • Политика конфиденциальности
  • Правила применения рекомендательных технологий в НИУ ВШЭ
  • Карта сайта
Редактору