?
VIA AI: Reliable Deep Reinforcement Learning for Traffic Signal Control
P. 887–890.
В книге
Curran Associates, 2024.
Timofei Gritsaev, Морозов Н. В., Самсонов С. В. и др., , in: Proceedings of the 13th International Conference on Learning Representations (ICLR 2025).: ICLR, 2025. P. 95626–95646.
Добавлено: 15 августа 2025 г.
Сапронов Ю. Ф., Юдин Н. Е., Computational Mathematics and Mathematical Physics 2025 Vol. 65 No. 3 P. 567–581
We continue to develop the concept of studying the ε-optimal policy for Average Reward Markov Decision Processes (AMDP) by reducing it to Discounted Markov Decision Processes (DMDP). Existing research often stipulates that the discount factor must not fall below a certain threshold. Typically, this threshold is close to one, and as is well-known, iterative methods ...
Добавлено: 10 июня 2025 г.
Anlló H., Bavard S., Benmarrakchi F. и др., Nature Human Behaviour 2024 Vol. 6 No. 8 P. 1554–1567
Добавлено: 17 июля 2024 г.
В данной статье представлена новая имитационная модель интеллектуальной транспортной системы (ИТС) «умного города» с адаптивным управлением светофорами. Предложенная транспортная модель, реализованная в AnyLogic, позволяет изучать поведение взаимодействующих агентов: транспортных средств (ТС) и пешеходов (П) в рамках многоагентной ИТС типа «Манхэттенской решетки». Пространственная динамика агентов в подобной ИТС описывается с использованием систем конечно-разностных уравнений с переменной ...
Добавлено: 25 мая 2024 г.
Кондрашова Е. В., / Series "Working papers by Cornell University". 2015.
Добавлено: 30 августа 2016 г.
Кондрашова Е. В., / Series "Working papers by Cornell University". 2015. No. 1509.05022.
Добавлено: 30 октября 2015 г.