Improving GFlowNets with Monte Carlo Tree Search

N. Morozov; D. Tiapkin; S. Samsonov; A. Naumov; D. Vetrov

Публикации

?

Improving GFlowNets with Monte Carlo Tree Search

Морозов Н. В., Тяпкин Д. Н., Самсонов С. В., Наумов А. А., Ветров Д. П.

Язык: английский

Текст на другом сайте

Ключевые слова: generative modeling deep reinforcement learning Generative Flow Networks

В книге

ICML 2024 Workshop on Structured Probabilistic Inference & Generative Modeling

OpenReview, 2024.

Learning-Based UAV–RIS Secure Communication Under Eavesdropper Location Uncertainty

Ehab S. Suleiman, Ali J. Dayoub, , in: Proceedings of the 2026 8th International Youth Conference on Radio Electronics, Electrical and Power Engineering (REEPE).: IEEE, 2026. Ch. 165 P. 1–6.

Добавлено: 30 апреля 2026 г.

Revisiting Non-Acyclic GFlowNets in Discrete Environments

Морозов Н. В., Максимов Я. В., Тяпкин Д. Н. и др., , in: Volume 267: International Conference on Machine Learning, 13-19 July 2025, Vancouver Convention Center, Vancouver, CanadaVol. 267.: [б.и.], 2025. P. 44887–44910.

Добавлено: 15 октября 2025 г.

Optimizing Backward Policies in GFlowNets via Trajectory Likelihood Maximization

Timofei Gritsaev, Морозов Н. В., Самсонов С. В. и др., , in: Proceedings of the 13th International Conference on Learning Representations (ICLR 2025).: ICLR, 2025. P. 95626–95646.

Добавлено: 15 августа 2025 г.

Optical stabilization for laser communication satellite systems through proportional–integral–derivative (PID) control and reinforcement learning approach

Бахшалиев Р. М., Reutov A., Vorobey S. и др., Review of Scientific Instruments 2025 Vol. 96 No. 3

Добавлено: 13 мая 2025 г.

Optimization of the Accelerator Control by Reinforcement Learning: A Simulation-Based Approach

Ибрахим А., Деркач Д. А., Petrenko A. и др., Physics of Particles and Nuclei 2025 Vol. 56 No. 6 P. 1476–1481

Добавлено: 16 марта 2025 г.

Generative models and seq2seq techniques for the flash-simulation of the LHCb experiment

Деркач Д. А., Anderlini L., Capelli S. и др., Proceedings of Science 2025 Vol. 476 P. 1032

Добавлено: 13 марта 2025 г.

Adaptive Algorithm for Selecting the Optimal Trading Strategy Based on Reinforcement Learning for Managing a Hedge Fund

Belyakov B., Сизых Д. С., IEEE Access 2024 Vol. 12 P. 189047–189063

В управлении хедж-фондами способность динамически выбирать оптимальные торговые стратегии имеет первостепенное значение для максимизации доходности и снижения риска. В этой статье представлен новаторский подход, который интегрирует обучение с подкреплением (RL), в частности алгоритм оптимизации проксимальной политики (PPO), в процесс выбора стратегии для управления хедж-фондами. Наша модель рассматривает разнообразный спектр стратегий, включая возврат к среднему и ...

Добавлено: 15 января 2025 г.

The LHCb ultra-fast simulation option, Lamarr design and validation

Деркач Д. А., Казеев Н. А., Мохненко С. Н. и др., EPJ Web of Conferences 2024 Vol. 295 P. 03040

Добавлено: 8 января 2025 г.

ICML 2024 Workshop on Structured Probabilistic Inference & Generative Modeling

OpenReview, 2024.

Добавлено: 24 октября 2024 г.

Star-Shaped Denoising Diffusion Probabilistic Models

Andrey Okhotin, Dmitry Molchanov, Arkhipkin V. и др., , in: Advances in Neural Information Processing Systems 36 (NeurIPS 2023).: Curran Associates, Inc., 2023. P. 10038–10067.

Добавлено: 15 февраля 2024 г.

When to Switch: Planning and Learning for Partially Observable Multi-Agent Pathfinding

Skrynnik A., Andreychuk A., Яковлев К. С. и др., IEEE Transactions on Neural Networks and Learning Systems 2024 Vol. 35 No. 12 P. 17411–17424

Добавлено: 4 декабря 2023 г.

Dealing With Sparse Rewards Using Graph Neural Networks

Gerasyov Matvey, Макаров И. А., IEEE Access 2023 Vol. 11 P. 89180–89187

Добавлено: 28 августа 2023 г.

Artificial Intelligence and Mathematical Models of Power Grids Driven by Renewable Energy Sources: A Survey

Сринивасан С., Kumarasamy S., Andreadakis Z. и др., Energies 2023 Vol. 16 No. 14 Article 5383

Добавлено: 17 июля 2023 г.

Maximum Entropy Model-based Reinforcement Learning

Свидченко О. А., Шпильман А. А., , in: NeurIPS'2021 Deep Reinforcement Learning Workshop.: [б.и.], 2021.

Добавлено: 24 марта 2022 г.

Self-Imitation Learning from Demonstrations

Иванов Д. И., Пшихачев Г. А., Егоров В. С. и др., , in: NeurIPS'2021 Deep Reinforcement Learning Workshop.: [б.и.], 2021.

Добавлено: 24 марта 2022 г.

NeurIPS'2021 Deep Reinforcement Learning Workshop

[б.и.], 2021.

Добавлено: 24 марта 2022 г.

21st IEEE International Conference on Data Mining Workshops, ICDMW 2021

IEEE Computer Society, 2021.

Добавлено: 4 февраля 2022 г.

Using RuGPT3-XL Model for RuNormAS competition

Emelyanov A., Shliazhko O., Katricheva N. и др., , in: Computational Linguistics and Intellectual Technologies: Papers from the Annual International Conference “Dialogue” (2021)Issue 20: Основной том.: -, 2021. Ch. 18 P. 204–212.

В статье представлена методология дообучения языковой модели RuGPT3-XL (Generative Pretrained Transformer-3 для русского языка) для задачи нормализации спанов текста. Решение представлено на конкурсе по двум задачам: Нормализация именованных сущностей (Named entity) и Нормализация более широкого класса фрагментов текста, включая нормализацию различных частей речи (Generic spans). Лучшее решение достигло точности 0.9645 для задачи нормализации фрагментов текста ...

Добавлено: 5 сентября 2021 г.