?
Markov Decision Processes and Stochastic Games with Total Effective Payoff
P. 103–115.
Гурвич В. А., Boros E., Elbassioni K., Makino K.
В книге
Vol. 30. , Dagstuhl: Schloss Dagstuhl--Leibniz-Zentrum fuer Informatik, 2015.
Добавлено: 10 ноября 2025 г.
Сапронов Ю. Ф., Юдин Н. Е., Computational Mathematics and Mathematical Physics 2025 Vol. 65 No. 3 P. 567–581
We continue to develop the concept of studying the ε-optimal policy for Average Reward Markov Decision Processes (AMDP) by reducing it to Discounted Markov Decision Processes (DMDP). Existing research often stipulates that the discount factor must not fall below a certain threshold. Typically, this threshold is close to one, and as is well-known, iterative methods ...
Добавлено: 10 июня 2025 г.
Руденко В. Д., Юдин Н. Е., Васин А. А., Компьютерные исследования и моделирование 2023 Т. 15 № 2 С. 329–353
В данной статье проведен обзор как исторических достижений, так и современных результатов в области марковских процессов принятия решений (Markov Decision Process, MDP) и выпуклой оптимизации. Данный обзор является первой попыткой освещения на русском языке области обучения с подкреплением в контексте выпуклой оптимизации. Рассматриваются фундаментальное уравнение Беллмана и построенные на его основе критерии оптимальности политики — ...
Добавлено: 29 ноября 2024 г.
Гладин Е. Л., Lavrik-Karmazin M., Zainullina K. и др., Proceedings of Machine Learning Research 2023 Vol. 206 P. 11506–11533
Добавлено: 6 ноября 2024 г.
Добавлено: 4 апреля 2024 г.
Игнатов А. Д., , in: 14th International Conference, OPTIMA 2023, Petrovac, Montenegro, September 18–22, 2023, Revised Selected Papers. Communications in Computer and Information Science (CCIS, volume 1913)Vol. 1913.: Springer, 2023. P. 173–187.
Добавлено: 18 января 2024 г.
Маршалко Г. Б., Математические вопросы криптографии 2014 Vol. 5 No. 2 P. 87–98
Добавлено: 7 октября 2022 г.
Chemodanov D., Esposito F., Calyam P. и др., IEEE Transactions on Network and Service Management 2019 Vol. 16 No. 1 P. 127–142
Добавлено: 3 декабря 2019 г.
Гурарий М. М., Жаров М. М., Русаков С. Г. и др., Информационные технологии 2018 Т. 24 № 7 С. 435–444
Рассмотрены направления совершенствования методов минимаксной оптимизации при решении задач проектирования, включающие: способ задания частных критериев в виде произвольной кусочно-линейной выпуклой функции; использование особенностей задачи и алгоритмов схемотехнического моделирования для ускорения процедур оптимизации; принципы построения алгоритма решения линейной минимаксной задачи на шаге оптимизации с учетом возможной многокритериальности. ...
Добавлено: 12 февраля 2019 г.
Гурвич В. А., Boros E., Elbassioni K. и др., Dynamic Games and Applications 2018 Vol. 8 No. 1 P. 22–41
Добавлено: 10 октября 2018 г.
Лазарев А. А., Pravdivets N., Nekrasov I., Algorithms 2018 Vol. 11 No. 4 P. 1–13
Добавлено: 1 октября 2018 г.
Михеев А. В., В кн.: Современное образование: содержание, технологии, качество. Материалы XXIV международной научно-методической конференции.Т. 2.: СПб.: Издательство СПбГЭТУ "ЛЭТИ", 2018. С. 55–56.
Рассматривается вопрос использования программного пакета MathCAD в университетском образовательном курсе для обучения решению задач оптимизации. Показано преимущество работы с данной программой и рассматриваются ее основные особенности в приложении к данному курсу/ ...
Добавлено: 24 апреля 2018 г.
Boros E., Elbassioni K., Гурвич В. А. и др., Optimization Letters 2017 Vol. 11 No. 8 P. 1499–1512
We consider two-person zero-sum stochastic mean payoff games with perfect information, or BWR-games, given by a digraph (Formula presented.), with local rewards (Formula presented.), and three types of positions: black (Formula presented.), white (Formula presented.), and random (Formula presented.) forming a partition of V. It is a long-standing open question whether a polynomial time algorithm ...
Добавлено: 18 мая 2017 г.
Каштанов В. А., Зайцева О. Б., М.: КУРС: ИНФРА-М, 2016.
Содержание книги делится на 2 части детерминированные и стохастические модели ИО.
Первая часть «Детерминированные модели исследования операций» - это базовый раздел, в котором акцент сделан на линейное программирование. Он наглядно иллюстрирует применение математического аппарата для построения оптимальных стратегий управления в экономических моделях. Алгоритмы построения оптимальных решений изложены в виде математических утверждений с их доказательствами.
Вторая часть – ...
Добавлено: 13 ноября 2016 г.
Беленький А. С., Applied Mathematics Letters 2007 Vol. 20 No. 7 P. 795–799
The maximin of a function being the minimum function of a sum of two bilinear functions with one and the same first vector argument belonging to a polyhedron is considered on a polyhedron of connected variables forming two second vector arguments of the bilinear functions. It is shown that finding the exact lower estimate of ...
Добавлено: 21 октября 2016 г.
Беленький А. С., Егорова Л. Г., / Series WP7 "Математические методы анализа решений в экономике, бизнесе и политике". 2016. No. 02.
В работе предложены два подхода к моделированию взаимодействия мелких и средних биржевых трейдров с биржей. В рамках этих подходов трейдеры могут формировать свои портфели финансовых инструментов, обращающихся на бирже, и управлять ими с использованием методов линейного, целочисленного и смешанного программирования. В отличие от предыдущих публикаций авторов по рассматриваемым в работе вопросам, помимо обычных ценных бумаг, ...
Добавлено: 27 июня 2016 г.
Беленький А. С., Егорова Л. Г., , in: Advances in Intelligent Systems and ComputingIssue 359: Modelling, Computation and Optimization in Information Systems and Management Sciences.: Switzerland: Springer, 2015. P. 257–268.
Добавлено: 1 июня 2015 г.
Беленький А. С., Егорова Л. Г., / Series WP7 "Математические методы анализа решений в экономике, бизнесе и политике". 2015. No. WP7/2015/02.
Предлагаются две математические модели, с использованием которых участник биржевых торгов на фондовой бирже может принимать решения по формированию и изменению своего инвестиционного портфеля. В первой модели используется способность трейдера прогнозиро- вать будущие значения стоимости каждого из интересующих его финансовых инструментов; при этом задачу отыскания оптимальных стратегий инвестирования трейдера в эти инструменты удается свести к задаче ...
Добавлено: 31 мая 2015 г.