?
Algorithm for Constrained Markov Decision Process with Linear Convergence
Proceedings of Machine Learning Research. 2023. Vol. 206. P. 11506–11533.
М.: Институт проблем управления им. В.А. Трапезникова РАН, 2024.
В сборник вошли материалы VIII Международной научной конференции «Информационные технологии и технические средства управления» (ICCT-2024). На конференции были рассмотрены вопросы, касающиеся перспектив развития научного приборостроения в телекоммуникационных и управляющих системах, биомедицинской информатики, аппаратного и программного обеспечения информационнокоммуникационных систем, надежности, диагностики и неразрушающего контроля, систем управления и автоматизации, цифровых экосистем, управления производством и логистикой, методов математического ...
Добавлено: 27 мая 2026 г.
Добавлено: 26 мая 2026 г.
Ильяшенко Ю. С., Шилин И. С., Stanislav Minkov, Russian Journal of Mathematical Physics 2026 Vol. 33 No. 1 P. 89–106
Добавлено: 26 мая 2026 г.
Андросов И. А., Proceedings of the Institute for System Programming of the RAS 2026 Vol. 38 No. 3 P. 87–114
В работе рассматриваются сети эхо-состояний (Echo State Network, ESN), которые являются одними из самых распространенных способов реализации резервуарных вычислений. Они состоят из рекуррентной нейронной сети, веса которой выбираются один раз и не обучаются, и выходного, обычно линейного, обучаемого слоя. Такой подход позволяет создавать энергоэффективные и быстрые нейронные сети, способные обучаться в режиме реального времени. Но ...
Добавлено: 26 мая 2026 г.
Добавлено: 25 мая 2026 г.
Караваева Е. А., Кулигин Л. А., Резуник Л. и др., Труды Института системного программирования РАН 2026 Т. 38 № 3 С. 67–94
В статье представлен метод рефакторинга исходного кода на основе интеграции большой языковой модели (LLM) и расширенной UML-модели программного кода. Предложенный подход позволяет выявлять проблемные участки кода с использованием функций тревожности и структурных метрик классов, а затем выполнять автоматизированный рефакторинг. Ключевой особенностью метода является использование LLM для генерации формальных спецификаций на языке OCL (Object Constraint Language), ...
Добавлено: 24 мая 2026 г.
Добавлено: 23 мая 2026 г.
Zaikin A., Sviridov I., Sosedka A. и др., Technologies 2026 Vol. 14 No. 2 Article 84
Добавлено: 23 мая 2026 г.
Добавлено: 22 мая 2026 г.
Лошкарева М. Е., Матвеева Н. Н., Вестник Томского государственного университета. История 2026 № 100 С. 112–118
Предпринята попытка применения сетевого анализа в изучении средневекового нарративного источ ника. Цель исследования – проверка гипотезы о политической фрагментарности как основной причины завоевания Уэльса Англией. Построены сети взаимодействий исторических лиц на основе данных валлийской Хроники принцев с 1193 по 1282 г. Построение сетей демонстрирует, что завоевано Англией было формально объеди ненное княжество, ослабляемое не столько ...
Добавлено: 22 мая 2026 г.
Селянин Ф. И., Journal of Dynamical and Control Systems 2026 Vol. 32 No. 2 Article 18
Добавлено: 21 мая 2026 г.
Ausubel L., Баранов О. В., Journal of Economic Theory 2026 Vol. 235 No. 106192
Добавлено: 20 мая 2026 г.
Denis Seliutskii, Russian Journal of Mathematical Physics 2025 Vol. 32 No. 2 P. 399–407
Добавлено: 19 мая 2026 г.
Добавлено: 19 мая 2026 г.
Rabat: Association for Computational Linguistics, 2026.
Добавлено: 19 мая 2026 г.
Добавлено: 19 мая 2026 г.
This paper presents Aerokinesis, an IoT-based software–hardware system for intuitive gesture-driven control of quadcopter unmanned aerial vehicles (UAVs), developed within the Robot Operating System 2 (ROS2) framework. The proposed system addresses the challenge of providing an accessible human–drone interaction interface for operators in scenarios where traditional remote controllers are impractical or unavailable. The architecture comprises ...
Добавлено: 19 мая 2026 г.
Добавлено: 10 ноября 2025 г.
Сапронов Ю. Ф., Юдин Н. Е., Computational Mathematics and Mathematical Physics 2025 Vol. 65 No. 3 P. 567–581
We continue to develop the concept of studying the ε-optimal policy for Average Reward Markov Decision Processes (AMDP) by reducing it to Discounted Markov Decision Processes (DMDP). Existing research often stipulates that the discount factor must not fall below a certain threshold. Typically, this threshold is close to one, and as is well-known, iterative methods ...
Добавлено: 10 июня 2025 г.
Гладин Е. Л., Гасников А. В., Двуреченский П. Е., Journal of Optimization Theory and Applications 2025 Vol. 204 No. 1 Article 1
Accuracy certificates for convex minimization problems allow for online verification of the accuracy of approximate solutions and provide a theoretically valid online stopping criterion. When solving the Lagrange dual problem, accuracy certificates produce a simple way to recover an approximate primal solution and estimate its accuracy. In this paper, we generalize accuracy certificates for the ...
Добавлено: 29 ноября 2024 г.
Schechtman S., Тяпкин Д. Н., Muehlebach M. и др., , in: Proceedings of Machine Learning Research: Volume 195: The Thirty Sixth Annual Conference on Learning Theory, 12-15 July 2023, Bangalore, IndiaVol. 195: The Thirty Sixth Annual Conference on Learning Theory, 12-15 July 2023, Bangalore, India.: PMLR, 2023. P. 1228–1258.
Добавлено: 1 декабря 2023 г.
Шнурков П. В., Новиков Д. А., Информатика и ее применения 2020 Т. 14 № 3 С. 101–108
Работа посвящена созданию и анализу общей концепции специальной стохастической модели с управлениями. Основная особенность модели заключается в том, что управляющие воздействия осуществляются в моменты времени, когда случайный процесс, описывающий исследуемую систему, достигает границы некоторого заданного подмножества множества состояний. Само управляющее воздействие заключается в переводе процесса из граничного в одно из внутренних состояний заданного подмножества. При ...
Добавлено: 10 ноября 2020 г.
Тюрин А. И., Компьютерные исследования и моделирование 2020 Т. 12 № 2 С. 263–274
In this work we consider a possibility to use the conception of (δ,L)-model of a function for optimization tasks, whereby solving a primal problem there is a necessity to recover a solution of a dual problem. The conception of (δ,L)-model is based on the conception of (δ,L)-oracle which was proposed by Devolder – Glineur – ...
Добавлено: 2 октября 2020 г.