?
Improving GFlowNets with Monte Carlo Tree Search
.
В книге
OpenReview, 2024.
Сулейман Э., Даюб А., , in: Proceedings of the 2026 8th International Youth Conference on Radio Electronics, Electrical and Power Engineering (REEPE).: IEEE, 2026. Ch. 165 P. 1–6.
Добавлено: 30 апреля 2026 г.
Морозов Н. В., Максимов Я. В., Тяпкин Д. Н. и др., , in: Volume 267: International Conference on Machine Learning, 13-19 July 2025, Vancouver Convention Center, Vancouver, CanadaVol. 267.: [б.и.], 2025. P. 44887–44910.
Добавлено: 15 октября 2025 г.
Timofei Gritsaev, Морозов Н. В., Самсонов С. В. и др., , in: Proceedings of the 13th International Conference on Learning Representations (ICLR 2025).: ICLR, 2025. P. 95626–95646.
Добавлено: 15 августа 2025 г.
Добавлено: 13 мая 2025 г.
Ибрахим А., Деркач Д. А., Petrenko A. и др., Physics of Particles and Nuclei 2025 Vol. 56 No. 6 P. 1476–1481
Добавлено: 16 марта 2025 г.
Добавлено: 13 марта 2025 г.
Belyakov B., Сизых Д. С., IEEE Access 2024 Vol. 12 P. 189047–189063
В управлении хедж-фондами способность динамически выбирать оптимальные торговые стратегии имеет первостепенное значение для максимизации доходности и снижения риска. В этой статье представлен новаторский подход, который интегрирует обучение с подкреплением (RL), в частности алгоритм оптимизации проксимальной политики (PPO), в процесс выбора стратегии для управления хедж-фондами. Наша модель рассматривает разнообразный спектр стратегий, включая возврат к среднему и ...
Добавлено: 15 января 2025 г.
Добавлено: 8 января 2025 г.
OpenReview, 2024.
Добавлено: 24 октября 2024 г.
Andrey Okhotin, Dmitry Molchanov, Arkhipkin V. и др., , in: Advances in Neural Information Processing Systems 36 (NeurIPS 2023).: Curran Associates, Inc., 2023. P. 10038–10067.
Добавлено: 15 февраля 2024 г.
Skrynnik A., Andreychuk A., Яковлев К. С. и др., IEEE Transactions on Neural Networks and Learning Systems 2024 Vol. 35 No. 12 P. 17411–17424
Добавлено: 4 декабря 2023 г.
Gerasyov Matvey, Макаров И. А., IEEE Access 2023 Vol. 11 P. 89180–89187
Добавлено: 28 августа 2023 г.
Добавлено: 17 июля 2023 г.
Свидченко О. А., Шпильман А. А., , in: NeurIPS'2021 Deep Reinforcement Learning Workshop.: [б.и.], 2021.
Добавлено: 24 марта 2022 г.
Иванов Д. И., Пшихачев Г. А., Егоров В. С. и др., , in: NeurIPS'2021 Deep Reinforcement Learning Workshop.: [б.и.], 2021.
Добавлено: 24 марта 2022 г.
IEEE Computer Society, 2021.
Добавлено: 4 февраля 2022 г.
Emelyanov A., Shliazhko O., Katricheva N. и др., , in: Computational Linguistics and Intellectual Technologies: Papers from the Annual International Conference “Dialogue” (2021)Issue 20: Основной том.: -, 2021. Ch. 18 P. 204–212.
В статье представлена методология дообучения языковой модели RuGPT3-XL (Generative Pretrained Transformer-3 для русского языка) для задачи нормализации спанов текста. Решение представлено на конкурсе по двум задачам: Нормализация именованных сущностей (Named entity) и Нормализация более широкого класса фрагментов текста, включая нормализацию различных частей речи (Generic spans). Лучшее решение достигло точности 0.9645 для задачи нормализации фрагментов текста ...
Добавлено: 5 сентября 2021 г.