Optimizing Backward Policies in GFlowNets via Trajectory Likelihood Maximization

Timofei Gritsaev; N. Morozov; S. Samsonov; D. Tiapkin

АБВ
АБВ
АБВ

Обычная версия сайта

Приоритетные направления

по году

Тематика

Новости

21 июля 2026 г.

«Нам бы хотелось, чтоб наши корпуса использовались больше»

Созданные в Международной лаборатории языковой конвергенции и Школе лингвистики НИУ ВШЭ корпуса абхазо-адыгских языков, на которых говорят народы Западного Кавказа, позволяют изучить их особенности, показывают возможности современного использования. Создание корпусов стало возможным благодаря серии экспедиций ученых и студентов Вышки на Кавказ, современным методам лингвистической обработки и взаимодействию с коллегами из региональных университетов. О работе лингвистов новостной службе «Вышка.Главное» рассказал ведущий научный сотрудник Международной лаборатории языковой конвергенции, доцент Школы лингвистики Юрий Ландер.

20 июля 2026 г.

В НИУ ВШЭ обсудили подходы к измерению качества питания школьников

В Высшей школе экономики состоялся научный семинар «Подходы к измерению качества питания российских школьников». Его участники заявили о необходимости пересмотра подходов к контролю за школьным питанием. Организаторами мероприятия выступили Институт социальной политики и базовая организация СНГ по вопросам питания учащихся АНО «Институт отраслевого питания».

15 июля 2026 г.

«Наука всемирна, она не знает границ»

Разработанные ординарным профессором, директором Международного центра анализа и выбора решений НИУ ВШЭ Фуадом Алескеровым и его коллегами методы сетевого анализа в библиометрии позволили определить особенности появления, взаимного влияния и цитирования публикаций в научных журналах. Частое цитирование разными изданиями одного или нескольких исследований означает высокое качество работы, а перекрестные ссылки внутри ограниченного круга журналов повышают вероятность формирования сети хищнических изданий.

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!

Публикации

?

Optimizing Backward Policies in GFlowNets via Trajectory Likelihood Maximization

P. 95626–95646.

Timofei Gritsaev, Морозов Н. В., Самсонов С. В., Тяпкин Д. Н.

Язык: английский

Текст на другом сайте

Ключевые слова: Sampling reinforcement learning (RL)Generative Flow Networks

ПУБЛИКАЦИЯ ПОДГОТОВЛЕНА ПО РЕЗУЛЬТАТАМ ПРОЕКТА:

Разработка теоретических основ и методов генеративного искусственного интеллекта и их приложение к неоднородным доменным областям (2025)

В книге

Proceedings of the 13th International Conference on Learning Representations (ICLR 2025)

ICLR, 2025.

Optimal navigation in two-dimensional flows: Control theory and reinforcement learning

Парфеньев В. М., Physical Review E - Statistical, Nonlinear, and Soft Matter Physics 2026 Vol. 114 P. 1–11

Добавлено: 17 июля 2026 г.

Revisiting Non-Acyclic GFlowNets in Discrete Environments

Морозов Н. В., Максимов Я. В., Тяпкин Д. Н. и др., , in: Volume 267: International Conference on Machine Learning, 13-19 July 2025, Vancouver Convention Center, Vancouver, CanadaVol. 267.: [б.и.], 2025. P. 44887–44910.

Добавлено: 15 октября 2025 г.

Optimal Approximation of Average Reward Markov Decision Processes

Сапронов Ю. Ф., Юдин Н. Е., Computational Mathematics and Mathematical Physics 2025 Vol. 65 No. 3 P. 567–581

We continue to develop the concept of studying the ε-optimal policy for Average Reward Markov Decision Processes (AMDP) by reducing it to Discounted Markov Decision Processes (DMDP). Existing research often stipulates that the discount factor must not fall below a certain threshold. Typically, this threshold is close to one, and as is well-known, iterative methods ...

Добавлено: 10 июня 2025 г.

VIA AI: Reliable Deep Reinforcement Learning for Traffic Signal Control

Герасёв М. С., Kiselev D., Бекетов М. Е. и др., , in: 2024 IEEE International Conference on Data Mining (ICDM) Workshops (ICDMW).: Curran Associates, 2024. P. 887–890.

Добавлено: 27 марта 2025 г.

Improving GFlowNets with Monte Carlo Tree Search

Морозов Н. В., Тяпкин Д. Н., Самсонов С. В. и др., , in: ICML 2024 Workshop on Structured Probabilistic Inference & Generative Modeling.: OpenReview, 2024.

Добавлено: 24 октября 2024 г.

Comparing experience- and description-based economic preferences across 11 countries

Anlló H., Bavard S., Benmarrakchi F. и др., Nature Human Behaviour 2024 Vol. 6 No. 8 P. 1554–1567

Добавлено: 17 июля 2024 г.

Marcinkiewicz-type discretization of L^p-norms under the Nikolskii-type inequality assumption

Косов Е. Д., Journal of Mathematical Analysis and Applications 2021 Vol. 504 No. 1 Article 125358

Добавлено: 1 октября 2021 г.

Roles of saliency and set size in ensemble averaging

Яковлев А. Ю., Уточкин И. С., Attention, Perception and Psychophysics 2021 Vol. 83 No. 3 P. 1251–1262

Добавлено: 4 сентября 2020 г.

Competitive Provision of Tune-ins under Common Private Information

Челик Л., International Journal of Industrial Organization 2016 Vol. 44 P. 113–122

Добавлено: 3 июня 2016 г.