• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • A
  • A
  • A
  • A
  • A
Обычная версия сайта
  • RU
  • EN
  • Национальный исследовательский университет «Высшая школа экономики»
  • Публикации ВШЭ
  • Глава
  • Self-Imitation Learning from Demonstrations
  • RU
  • EN
Расширенный поиск
Высшая школа экономики
Национальный исследовательский университет
Приоритетные направления
  • бизнес-информатика
  • государственное и муниципальное управление
  • гуманитарные науки
  • инженерные науки
  • компьютерно-математическое
  • математика
  • менеджмент
  • право
  • социология
  • экономика
по году
  • 2027
  • 2026
  • 2025
  • 2024
  • 2023
  • 2022
  • 2021
  • 2020
  • 2019
  • 2018
  • 2017
  • 2016
  • 2015
  • 2014
  • 2013
  • 2012
  • 2011
  • 2010
  • 2009
  • 2008
  • 2007
  • 2006
  • 2005
  • 2004
  • 2003
  • 2002
  • 2001
  • 2000
  • 1999
  • 1998
  • 1997
  • 1996
  • 1995
  • 1994
  • 1993
  • 1992
  • 1991
  • 1990
  • 1989
  • 1988
  • 1987
  • 1986
  • 1985
  • 1984
  • 1983
  • 1982
  • 1981
  • 1980
  • 1979
  • 1978
  • 1977
  • 1976
  • 1975
  • 1974
  • 1973
  • 1972
  • 1971
  • 1970
  • 1969
  • 1968
  • 1967
  • 1966
  • 1965
  • 1964
  • 1963
  • 1958
  • еще
Тематика
Новости
30 июня 2026 г.
Аспирантка НИУ ВШЭ получила премию за выдающуюся научную статью
Международное научное общество по коллективному выбору и экономике благосостояния — Society for Social Choice and Welfare (SSCW) — присудило награду для молодых исследователей Ангелине Юдиной, аспирантке и преподавателю департамента математики ФЭН, младшему научному сотруднику Международного центра анализа и выбора решений НИУ ВШЭ. Ученые отметили ее статью, посвященную решениям задачи выбора наилучших альтернатив на основании результатов их попарных сравнений.
30 июня 2026 г.
«Я хотела бы, чтобы мои исследования помогали делать мир спокойнее и лучше»
Какую бы задачу ни решала младший научный сотрудник Лаборатории методов анализа больших данных Института искусственного интеллекта и цифровых наук ФКН ВШЭ Сараа Али, она думает, какую пользу она может принести людям. О своей большой семье, диагностике трехфазных двигателей и мечте построить на родине детский приют она рассказала проекту «Молодые ученые Вышки».
30 июня 2026 г.
Экономисты ВШЭ научились прогнозировать рождаемость по поисковым запросам
Сотрудники факультета экономических наук НИУ ВШЭ показали, что точность прогноза рождаемости в России можно улучшить почти в полтора раза, если добавить в модель динамику поисковых запросов по темам, связанным с беременностью и родами. В наиболее эффективных моделях ошибка прогноза снижается с 4,6 до 3,2%. Результаты исследования опубликованы в журнале Populations and Economics.

 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!

Публикации
  • Книги
  • Статьи
  • Главы в книгах
  • Препринты
  • Верификация публикаций
  • Расширенный поиск
  • Правила использования материалов
  • Наука в ВШЭ

?

Self-Imitation Learning from Demonstrations

.
Иванов Д. И., Пшихачев Г. А., Егоров В. С., Шпильман А. А.
Язык: английский
Ключевые слова: deep reinforcement learning

В книге

NeurIPS'2021 Deep Reinforcement Learning Workshop
[б.и.], 2021.
Похожие публикации
Learning-Based UAV–RIS Secure Communication Under Eavesdropper Location Uncertainty
Ehab S. Suleiman, Ali J. Dayoub, , in: Proceedings of the 2026 8th International Youth Conference on Radio Electronics, Electrical and Power Engineering (REEPE).: IEEE, 2026. Ch. 165 P. 1–6.
Добавлено: 30 апреля 2026 г.
Optical stabilization for laser communication satellite systems through proportional–integral–derivative (PID) control and reinforcement learning approach
Бахшалиев Р. М., Reutov A., Vorobey S. и др., Review of Scientific Instruments 2025 Vol. 96 No. 3
Добавлено: 13 мая 2025 г.
Optimization of the Accelerator Control by Reinforcement Learning: A Simulation-Based Approach
Ибрахим А., Деркач Д. А., Petrenko A. и др., Physics of Particles and Nuclei 2025 Vol. 56 No. 6 P. 1476–1481
Добавлено: 16 марта 2025 г.
Adaptive Algorithm for Selecting the Optimal Trading Strategy Based on Reinforcement Learning for Managing a Hedge Fund
Belyakov B., Сизых Д. С., IEEE Access 2024 Vol. 12 P. 189047–189063
В управлении хедж-фондами способность динамически выбирать оптимальные торговые стратегии имеет первостепенное значение для максимизации доходности и снижения риска. В этой статье представлен новаторский подход, который интегрирует обучение с подкреплением (RL), в частности алгоритм оптимизации проксимальной политики (PPO), в процесс выбора стратегии для управления хедж-фондами. Наша модель рассматривает разнообразный спектр стратегий, включая возврат к среднему и ...
Добавлено: 15 января 2025 г.
Improving GFlowNets with Monte Carlo Tree Search
Морозов Н. В., Тяпкин Д. Н., Самсонов С. В. и др., , in: ICML 2024 Workshop on Structured Probabilistic Inference & Generative Modeling.: OpenReview, 2024.
Добавлено: 24 октября 2024 г.
When to Switch: Planning and Learning for Partially Observable Multi-Agent Pathfinding
Skrynnik A., Andreychuk A., Яковлев К. С. и др., IEEE Transactions on Neural Networks and Learning Systems 2024 Vol. 35 No. 12 P. 17411–17424
Добавлено: 4 декабря 2023 г.
Dealing With Sparse Rewards Using Graph Neural Networks
Gerasyov Matvey, Макаров И. А., IEEE Access 2023 Vol. 11 P. 89180–89187
Добавлено: 28 августа 2023 г.
Artificial Intelligence and Mathematical Models of Power Grids Driven by Renewable Energy Sources: A Survey
Сринивасан С., Kumarasamy S., Andreadakis Z. и др., Energies 2023 Vol. 16 No. 14 Article 5383
Добавлено: 17 июля 2023 г.
Maximum Entropy Model-based Reinforcement Learning
Свидченко О. А., Шпильман А. А., , in: NeurIPS'2021 Deep Reinforcement Learning Workshop.: [б.и.], 2021.
Добавлено: 24 марта 2022 г.
NeurIPS'2021 Deep Reinforcement Learning Workshop
[б.и.], 2021.
Добавлено: 24 марта 2022 г.
21st IEEE International Conference on Data Mining Workshops, ICDMW 2021
IEEE Computer Society, 2021.
Добавлено: 4 февраля 2022 г.
  • О ВЫШКЕ
  • Цифры и факты
  • Руководство и структура
  • Устойчивое развитие в НИУ ВШЭ
  • Преподаватели и сотрудники
  • Корпуса и общежития
  • Закупки
  • Обращения граждан в НИУ ВШЭ
  • Фонд целевого капитала
  • Противодействие коррупции
  • Сведения о доходах, расходах, об имуществе и обязательствах имущественного характера
  • Сведения об образовательной организации
  • Людям с ограниченными возможностями здоровья
  • Единая платежная страница
  • Работа в Вышке
  • ОБРАЗОВАНИЕ
  • Лицей
  • Довузовская подготовка
  • Олимпиады
  • Прием в бакалавриат
  • Вышка+
  • Прием в магистратуру
  • Аспирантура
  • Дополнительное образование
  • Центр развития карьеры
  • Бизнес-инкубатор ВШЭ
  • Образовательные партнерства
  • Обратная связь и взаимодействие с получателями услуг
  • НАУКА
  • Научные подразделения
  • Исследовательские проекты
  • Мониторинги
  • Диссертационные советы
  • Защиты диссертаций
  • Академическое развитие
  • Конкурсы и гранты
  • Внешние научно-информационные ресурсы
  • РЕСУРСЫ
  • Библиотека
  • Издательский дом ВШЭ
  • Книжный магазин «БукВышка»
  • Типография
  • Медиацентр
  • Журналы ВШЭ
  • Публикации
  • http://www.minobrnauki.gov.ru/
    Министерство науки и высшего образования РФ
  • https://edu.gov.ru/
    Министерство просвещения РФ
  • http://www.edu.ru
    Федеральный портал «Российское образование»
  • https://elearning.hse.ru/mooc
    Массовые открытые онлайн-курсы
  • НИУ ВШЭ1993–2026
  • Адреса и контакты
  • Условия использования материалов
  • Политика конфиденциальности
  • Правила применения рекомендательных технологий в НИУ ВШЭ
  • Карта сайта
Редактору