Markov Decision Processes and Stochastic Games with Total Effective Payoff

We continue to develop the concept of studying the ε-optimal policy for Average Reward Markov Decision Processes (AMDP) by reducing it to Discounted Markov Decision Processes (DMDP). Existing research often stipulates that the discount factor must not fall below a certain threshold. Typically, this threshold is close to one, and as is well-known, iterative methods ...

Добавлено: 10 июня 2025 г.

On the problem of optimal fair exchange

Колесников А. В., Попова С. Н., / Series arXiv "math". 2024.

Добавлено: 20 декабря 2024 г.

Обзор выпуклой оптимизации марковских процессов принятия решений

Руденко В. Д., Юдин Н. Е., Васин А. А., Компьютерные исследования и моделирование 2023 Т. 15 № 2 С. 329–353

В данной статье проведен обзор как исторических достижений, так и современных результатов в области марковских процессов принятия решений (Markov Decision Process, MDP) и выпуклой оптимизации. Данный обзор является первой попыткой освещения на русском языке области обучения с подкреплением в контексте выпуклой оптимизации. Рассматриваются фундаментальное уравнение Беллмана и построенные на его основе критерии оптимальности политики — ...

Добавлено: 29 ноября 2024 г.

Algorithm for Constrained Markov Decision Process with Linear Convergence

Гладин Е. Л., Lavrik-Karmazin M., Zainullina K. и др., Proceedings of Machine Learning Research 2023 Vol. 206 P. 11506–11533

Добавлено: 6 ноября 2024 г.

On a simple connection between Δ-modular ILP and LP, and a new bound on the number of integer vertices

Грибанов Д. В., Малышев Д. С., Shumilov I., Operations Research Forum 2024 Vol. 5 Article 32

Добавлено: 4 апреля 2024 г.

Exact Algorithm for Generating H-Cores in Simplified Lattice-Based Protein Model

Игнатов А. Д., , in: 14th International Conference, OPTIMA 2023, Petrovac, Montenegro, September 18–22, 2023, Revised Selected Papers. Communications in Computer and Information Science (CCIS, volume 1913)Vol. 1913.: Springer, 2023. P. 173–187.

Добавлено: 18 января 2024 г.

О безопасности схемы биометрической аутентификации, основанной на нейронной сети

Маршалко Г. Б., Математические вопросы криптографии 2014 Vol. 5 No. 2 P. 87–98

Добавлено: 7 октября 2022 г.

A Constrained Shortest Path Scheme for Virtual Network Service Management

Chemodanov D., Esposito F., Calyam P. и др., IEEE Transactions on Network and Service Management 2019 Vol. 16 No. 1 P. 127–142

Добавлено: 3 декабря 2019 г.

Минимаксная оптимизация в задачах схемотехнического проектирования

Гурарий М. М., Жаров М. М., Русаков С. Г. и др., Информационные технологии 2018 Т. 24 № 7 С. 435–444

Рассмотрены направления совершенствования методов минимаксной оптимизации при решении задач проектирования, включающие: способ задания частных критериев в виде произвольной кусочно-линейной выпуклой функции; использование особенностей задачи и алгоритмов схемотехнического моделирования для ускорения процедур оптимизации; принципы построения алгоритма решения линейной минимаксной задачи на шаге оптимизации с учетом возможной многокритериальности. ...

Добавлено: 12 февраля 2019 г.

A Potential Reduction Algorithm for Two-Person Zero-Sum Mean Payoff Stochastic Games

Гурвич В. А., Boros E., Elbassioni K. и др., Dynamic Games and Applications 2018 Vol. 8 No. 1 P. 22–41

Добавлено: 10 октября 2018 г.

Evaluating Typical Algorithms of Combinatorial Optimization to Solve Continuous-Time Based Scheduling Problem

Лазарев А. А., Pravdivets N., Nekrasov I., Algorithms 2018 Vol. 11 No. 4 P. 1–13

Добавлено: 1 октября 2018 г.

Применение программного пакета MathCAD для обучения решению задач линейного программирования

Михеев А. В., В кн.: Современное образование: содержание, технологии, качество. Материалы XXIV международной научно-методической конференции.Т. 2.: СПб.: Издательство СПбГЭТУ "ЛЭТИ", 2018. С. 55–56.

Рассматривается вопрос использования программного пакета MathCAD в университетском образовательном курсе для обучения решению задач оптимизации. Показано преимущество работы с данной программой и рассматриваются ее основные особенности в приложении к данному курсу/ ...

Добавлено: 24 апреля 2018 г.

A convex programming-based algorithm for mean payoff stochastic games with perfect information

Boros E., Elbassioni K., Гурвич В. А. и др., Optimization Letters 2017 Vol. 11 No. 8 P. 1499–1512

We consider two-person zero-sum stochastic mean payoff games with perfect information, or BWR-games, given by a digraph (Formula presented.), with local rewards (Formula presented.), and three types of positions: black (Formula presented.), white (Formula presented.), and random (Formula presented.) forming a partition of V. It is a long-standing open question whether a polynomial time algorithm ...

Добавлено: 18 мая 2017 г.

Исследование операций. Линейное программирование и стохастические модели.

Каштанов В. А., Зайцева О. Б., М.: КУРС: ИНФРА-М, 2016.

Содержание книги делится на 2 части детерминированные и стохастические модели ИО. Первая часть «Детерминированные модели исследования операций» - это базовый раздел, в котором акцент сделан на линейное программирование. Он наглядно иллюстрирует применение математического аппарата для построения оптимальных стратегий управления в экономических моделях. Алгоритмы построения оптимальных решений изложены в виде математических утверждений с их доказательствами. Вторая часть – ...

Добавлено: 13 ноября 2016 г.

Finding the exact lower estimate of the maximin of a minimum function on a polyhedron of connected variables

Беленький А. С., Applied Mathematics Letters 2007 Vol. 20 No. 7 P. 795–799

The maximin of a function being the minimum function of a sum of two bilinear functions with one and the same first vector argument belonging to a polyhedron is considered on a polyhedron of connected variables forming two second vector arguments of the bilinear functions. It is shown that finding the exact lower estimate of ...

Добавлено: 21 октября 2016 г.

Two approaches to modeling the interaction of small and medium price-taking traders with a stock exchange by mathematical programming techniques

Беленький А. С., Егорова Л. Г., / Series WP7 "Математические методы анализа решений в экономике, бизнесе и политике". 2016. No. 02.

В работе предложены два подхода к моделированию взаимодействия мелких и средних биржевых трейдров с биржей. В рамках этих подходов трейдеры могут формировать свои портфели финансовых инструментов, обращающихся на бирже, и управлять ими с использованием методов линейного, целочисленного и смешанного программирования. В отличие от предыдущих публикаций авторов по рассматриваемым в работе вопросам, помимо обычных ценных бумаг, ...

Добавлено: 27 июня 2016 г.

An Approach to Forming and Managing a Portfolio of Financial Securities by Small and Medium Price-Taking Traders in a Stock Exchange

Беленький А. С., Егорова Л. Г., , in: Advances in Intelligent Systems and ComputingIssue 359: Modelling, Computation and Optimization in Information Systems and Management Sciences.: Switzerland: Springer, 2015. P. 257–268.

Добавлено: 1 июня 2015 г.

Две модели принятия решений участником торгов на фондовой бирже по формированию и изменению своего инвестиционного портфеля

Беленький А. С., Егорова Л. Г., / Series WP7 "Математические методы анализа решений в экономике, бизнесе и политике". 2015. No. WP7/2015/02.

Предлагаются две математические модели, с использованием которых участник биржевых торгов на фондовой бирже может принимать решения по формированию и изменению своего инвестиционного портфеля. В первой модели используется способность трейдера прогнозиро- вать будущие значения стоимости каждого из интересующих его финансовых инструментов; при этом задачу отыскания оптимальных стратегий инвестирования трейдера в эти инструменты удается свести к задаче ...

Добавлено: 31 мая 2015 г.

Finding Optimal Production and Selling Strategies for an Electricity Generator in a Part of a Country’s Electrical Grid

Беленький А. С., Procedia Computer Science 2014 Vol. 31 P. 1150–1159

Добавлено: 29 сентября 2014 г.