?
Optimistic Posterior Sampling for Reinforcement Learning with Few Samples and Tight Guarantees
P. 10737-10751.
Тяпкин Д. Н., Беломестный Д. В., Calandriello D., Éric Moulines, Munos R., Наумов А. А., Rowland M., Valko M., Menard P.
Ключевые слова: reinforcement learning
ПУБЛИКАЦИЯ ПОДГОТОВЛЕНА ПО РЕЗУЛЬТАТАМ ПРОЕКТА:
В книге
Curran Associates, Inc., 2022
Шпильман А. А., Никулин А. П., Proceedings of Machine Learning Research 2022 Vol. 176 P. 13-28
Добавлено: 10 октября 2023 г.
Тяпкин Д. Н., Беломестный Д. В., Calandriello D. и др., , in : Advances in Neural Information Processing Systems 36 (NeurIPS 2023). : Curran Associates, Inc., 2023. P. 73719-73774.
Добавлено: 17 февраля 2024 г.
Keramati M., Гуткин Б. С., eLife 2014 Vol. 2 No. 3
Efficient regulation of internal homeostasis and defending it against perturbations requires adaptive behavioral strategies. However, the computational principles mediating the interaction between homeostatic and associative learning processes remain undefined. Here we use a definition of primary rewards, as outcomes fulfilling physiological needs, to build a normative theory showing how learning motivated behaviors may be modulated ...
Добавлено: 19 декабря 2014 г.
Каледин М. Л., Мулине Э. Ф., Наумов А. А. и др., , in : Proceedings of Machine Learning Research. Vol. 125: Proceedings of Thirty Third Conference on Learning Theory.: [б.и.], 2020. P. 2144-2203.
Добавлено: 30 июля 2020 г.
Лубашевский И. А., Hijikata K., , in : Proceedings of the 48th ISCIE International Symposium on Stochastic Systems Theory and its Applications. Vol. 2017.: Kyoto : The Institute of Systems, Control and Information Engineers , 2017. P. 190-196.
Добавлено: 5 ноября 2021 г.
Шпильман А. А., Kudenko D., Gaydashenko A., , in : 2018 17th IEEE International Conference on Machine Learning and Applications (ICMLA). : IEEE, 2018. P. 553-557.
Robot navigation through crowds poses a difficult challenge to AI systems, since the methods should result in fast and efficient movement but at the same time are not allowed to compromise safety. Most approaches to date were focused on the combination of pathfinding algorithms with machine learning for pedestrian walking prediction. More recently, reinforcement learning ...
Добавлено: 18 января 2019 г.
Карпов М. Е., Арзыматов К., Белавин В. С. и др., International Journal of Civil Engineering and Technology 2018 Vol. 9 No. 11 P. 220-226
Добавлено: 14 ноября 2019 г.
Тяпкин Д. Н., Беломестный Д. В., Наумов А. А. и др., Working papers by Cornell University. Series math "arxiv.org" 2023 Article 2304.03056
In this work, we derive sharp non-asymptotic deviation bounds for weighted sums of Dirichlet random variables. These bounds are based on a novel integral representation of the density of a weighted Dirichlet sum. This representation allows us to obtain a Gaussian-like approximation for the sum distribution using geometry and complex analysis methods. Our results generalize ...
Добавлено: 28 июня 2023 г.
Малышева А. И., PEROLAT J., VYLDER B. D., American Association for the Advancement of Science 378.6623 2022 Vol. 378 No. 6623 P. 990-996
Добавлено: 17 июня 2023 г.
Springer, 2019
Добавлено: 30 октября 2020 г.
Bobrov E., Kropotov Dmitry, Lu H. и др., IEEE Communications Letters 2022 Vol. 26 No. 4 P. 818-822
Добавлено: 26 октября 2022 г.
Мартинез Саито М., Gorina E., Human Brain Mapping 2022 Vol. 43 No. 13 P. 4185-4206
Добавлено: 27 мая 2022 г.
Добавлено: 3 сентября 2018 г.
Шестакова А. Н., Ключарёв В. А., , in : Brain Mapping: An Encyclopedic Reference. : San Diego : Academic Press, 2015.
Our decisions are affected not only by objective information about the available options but also by other people. Recent brain imaging studies have adopted the cognitive neuroscience approach for studying the neural mechanisms of social influence. A number of studies have shown that social influence is associated with neural activity in the medial prefrontal cortex ...
Добавлено: 22 октября 2014 г.
Шестакова А. Н., Rieskamp J., Tugin S. и др., Social Cognitive and Affective Neuroscience 2013 Vol. 8 No. 7 P. 756-763
Humans often change their beliefs or behavior due to the behavior or opinions of others. This study explored, with the use of human event-related potentials (ERPs), whether social conformity is based on a general performance-monitoring mechanism. We tested the hypothesis that conflicts with a normative group opinion evoke a feedback-related negativity (FRN) often associated with ...
Добавлено: 6 июня 2013 г.
Ayunts E., Панов А. И., , in : Biologically Inspired Cognitive Architectures (BICA) for Young Scientists. : Springer, 2017. P. 3-9.
Добавлено: 31 августа 2017 г.
Лубашевский И. А., Kanemoto S., The European Physical Journal B 2010 Vol. 76 No. 1 P. 69-85
Добавлено: 6 ноября 2021 г.
Макаров И. А., Mikhail Tokmakov, Pavel Polyakov и др., , in : Proceedings of the 24th ACM international conference on Multimedia (ACM MM'16), Amsterdam, Netherlands, 15-19 October 2016. : NY : Association for Computing Machinery (ACM), 2016. P. 735-736.
Добавлено: 28 августа 2016 г.
Тяпкин Д. Н., Alexander Gasnikov, , in : International Conference on Artificial Intelligence and Statistics, 28-30 March 2022, A Virtual Conference. Vol. 151: Proceedings of The 25th International Conference on Artificial Intelligence and Statistics.: PMLR, 2022. P. 9723-9740.
Добавлено: 16 октября 2022 г.
Keramati M., Durand A., Girardeau P. и др., Psychological Review 2017 Vol. 124 No. 2 P. 130-153
Drug addiction implicates both reward learning and homeostatic regulation mechanisms of the brain. This has stimulated 2 partially successful theoretical perspectives on addiction. Many important aspects of addiction, however, remain to be explained within a single, unified framework that integrates the 2 mechanisms. Building upon a recently developed homeostatic reinforcement learning theory, the authors focus on ...
Добавлено: 7 апреля 2017 г.
Лубашевский И. А., Zgonnikov A., Advances in Complex Systems 2014 Vol. 17 No. 3-4 Article 1450013
Добавлено: 6 ноября 2021 г.
Тяпкин Д. Н., Беломестный Д. В., Calandriello D. и др., , in : Proceedings of the 40th International Conference on Machine Learning: Volume 202: International Conference on Machine Learning, 23-29 July 2023, Honolulu, Hawaii, USA. Vol. 202: International Conference on Machine Learning, 23-29 July 2023, Honolulu, Hawaii, USA.: PMLR, 2023. P. 34161-34221.
Добавлено: 1 декабря 2023 г.
[б.и.], 2019
Добавлено: 13 июня 2019 г.
С. М. Авдошин, Г. А. Арутюнов, Информационные технологии 2022 Т. 28 № 7 С. 378-391
В условиях пандемии как никогда стала актуальной проблема нехватки кадров в сфере информационных технологий. По оценкам аналитиков в 2021 году Россия не досчиталась от 500 тыс. до 1 млн IT-специалистов. Образование и вывод на рынок такого большого числа специалистов может занять годы. Очень остро стоит вопрос оптимизации процесса создания IT-решений, в том числе путем разработки ...
Добавлено: 11 июня 2022 г.