?
MAGNet: Multi-agent Graph Network for Deep Multi-agent Reinforcement Learning
P. 1-8.
[б.и.], 2019
Добавлено: 13 июня 2019 г.
Шестакова А. Н., Rieskamp J., Tugin S. и др., Social Cognitive and Affective Neuroscience 2013 Vol. 8 No. 7 P. 756-763
Humans often change their beliefs or behavior due to the behavior or opinions of others. This study explored, with the use of human event-related potentials (ERPs), whether social conformity is based on a general performance-monitoring mechanism. We tested the hypothesis that conflicts with a normative group opinion evoke a feedback-related negativity (FRN) often associated with ...
Добавлено: 6 июня 2013 г.
Dmitry Akimov, Макаров И. А., , in : Proceedings of the Fifth Workshop on Experimental Economics and Machine Learning at the National Research University Higher School of Economics co-located with the Seventh International Conference on Applied Research in Economics (iCare7). : Aachen : CEUR Workshop Proceedings, 2019. P. 3-17.
In this work, we study deep reinforcement algorithms for partially observable Markov decision processes (POMDP) combined with Deep Q-Networks. To our knowledge, we are the first to apply standard Markov decision process architectures to POMDP scenarios. We propose an extension of DQN with Dueling Networks and several other model-free policies to training agent using deep ...
Добавлено: 19 ноября 2019 г.
Тяпкин Д. Н., Беломестный Д. В., Calandriello D. и др., , in : Proceedings of the 40th International Conference on Machine Learning: Volume 202: International Conference on Machine Learning, 23-29 July 2023, Honolulu, Hawaii, USA. Vol. 202: International Conference on Machine Learning, 23-29 July 2023, Honolulu, Hawaii, USA.: PMLR, 2023. P. 34161-34221.
Добавлено: 1 декабря 2023 г.
Каледин М. Л., Мулине Э. Ф., Наумов А. А. и др., , in : Proceedings of Machine Learning Research. Vol. 125: Proceedings of Thirty Third Conference on Learning Theory.: [б.и.], 2020. P. 2144-2203.
Добавлено: 30 июля 2020 г.
Александров Д. В., Савицкий М., В кн. : Научно-образовательная информационная среда XXI века : материалы X Всероссийской научн.-практ. конф. (20-23 сентября 2016 года). – Петрозаводск, 2016. - 188 с. : Петрозаводск : Петрозаводский государственный университет, 2016. С. 177-180.
Рассматривается постановка задачи повышения эффективности моделирования многокомпонентных IoT-систем ...
Добавлено: 15 марта 2017 г.
Шпильман А. А., Malysheva A., Sung T. T. и др., , in : Deep RL Workshop NeurIPS 2018. : [б.и.], 2018. P. 1-10.
Добавлено: 18 января 2019 г.
Манита А. Д., Манита Л. А., Journal of Physics: Conference Series 2018 Vol. 955 No. 012038 P. 1-6
Добавлено: 19 мая 2018 г.
Keramati M., Гуткин Б. С., eLife 2014 Vol. 2 No. 3
Efficient regulation of internal homeostasis and defending it against perturbations requires adaptive behavioral strategies. However, the computational principles mediating the interaction between homeostatic and associative learning processes remain undefined. Here we use a definition of primary rewards, as outcomes fulfilling physiological needs, to build a normative theory showing how learning motivated behaviors may be modulated ...
Добавлено: 19 декабря 2014 г.
Малышева А. И., PEROLAT J., VYLDER B. D., American Association for the Advancement of Science 378.6623 2022 Vol. 378 No. 6623 P. 990-996
Добавлено: 17 июня 2023 г.
Лубашевский И. А., Zgonnikov A., Advances in Complex Systems 2014 Vol. 17 No. 3-4 Article 1450013
Добавлено: 6 ноября 2021 г.
Maria Bakhanova, Ilya Makarov, , in : Advances in Computational Intelligence: 16th International Work-Conference on Artificial Neural Networks, IWANN 2021, Virtual Event, June 16–18, 2021, Proceedings, Part I. * 1. Vol. 12861.: Springer, 2021. Ch. 12. P. 138-150.
In this work, we study the problem of learning reinforcement learning-based agents in a first-person shooter environment VizDoom. We compare several well-known architectures, such as DQN, DDQN, A3C, and Curiosity-driven model, while highlighting the main differences in learned policies of agents trained via these models. ...
Добавлено: 1 сентября 2021 г.
Springer, 2019
Добавлено: 30 октября 2020 г.
Лубашевский И. А., Kanemoto S., The European Physical Journal B 2010 Vol. 76 No. 1 P. 69-85
Добавлено: 6 ноября 2021 г.
Ayunts E., Панов А. И., , in : Biologically Inspired Cognitive Architectures (BICA) for Young Scientists. : Springer, 2017. P. 3-9.
Добавлено: 31 августа 2017 г.
Карпов М. Е., Арзыматов К., Белавин В. С. и др., International Journal of Civil Engineering and Technology 2018 Vol. 9 No. 11 P. 220-226
Добавлено: 14 ноября 2019 г.
Cham : Springer, 2015
The Smart Innovation, Systems and Technologies book series encompasses the topics of knowledge, intelligence, innovation and sustainability. The aim of the series is to make available a platform for the publication of books on all aspects of single and multi-disciplinary research on these themes in order to make the latest results available in a readily-accessible ...
Добавлено: 12 февраля 2016 г.
Laurent F., Schneider M., Scheller C. и др., , in : Proceedings of Machine Learning Research. Vol. 133: Proceedings of the NeurIPS 2020: Competition and Demonstration Track.: PMLR, 2021. P. 275-301.
Добавлено: 6 сентября 2021 г.
Макаров И. А., Mikhail Tokmakov, Pavel Polyakov и др., , in : Proceedings of the 24th ACM international conference on Multimedia (ACM MM'16), Amsterdam, Netherlands, 15-19 October 2016. : NY : Association for Computing Machinery (ACM), 2016. P. 735-736.
Добавлено: 28 августа 2016 г.
Тяпкин Д. Н., Беломестный Д. В., Наумов А. А. и др., Working papers by Cornell University. Series math "arxiv.org" 2023 Article 2304.03056
In this work, we derive sharp non-asymptotic deviation bounds for weighted sums of Dirichlet random variables. These bounds are based on a novel integral representation of the density of a weighted Dirichlet sum. This representation allows us to obtain a Gaussian-like approximation for the sum distribution using geometry and complex analysis methods. Our results generalize ...
Добавлено: 28 июня 2023 г.
Морозова Ю. А., Логистика и управление цепями поставок 2015 № 2 С. 69-76
Постоянные изменения спроса на ресурсы на рынках затрудняют планирование и управление потоками материалов. В современной практике для решения этой проблемы применяются мультиагентные системы, которые представляют собой совокупность взаимодействующих программных объектов, называемых интеллектуальными агентами. Деятельность интеллектуального агента направлена на достижение индивидуальной цели, в качестве которых могут выступать поиск возможностей поставки, реализации, хранения товаров, перевозки грузов и ...
Добавлено: 28 июня 2015 г.
Keramati M., Durand A., Girardeau P. и др., Psychological Review 2017 Vol. 124 No. 2 P. 130-153
Drug addiction implicates both reward learning and homeostatic regulation mechanisms of the brain. This has stimulated 2 partially successful theoretical perspectives on addiction. Many important aspects of addiction, however, remain to be explained within a single, unified framework that integrates the 2 mechanisms. Building upon a recently developed homeostatic reinforcement learning theory, the authors focus on ...
Добавлено: 7 апреля 2017 г.
Тяпкин Д. Н., Alexander Gasnikov, , in : International Conference on Artificial Intelligence and Statistics, 28-30 March 2022, A Virtual Conference. Vol. 151: Proceedings of The 25th International Conference on Artificial Intelligence and Statistics.: PMLR, 2022. P. 9723-9740.
Добавлено: 16 октября 2022 г.