Reinforcement Procedure for Randomized Machine Learning

Yuri S. Popkov; Y. A. Dubnov; Alexey Yu. Popkov

doi:10.3390/math11173651

Публикации

?

Reinforcement Procedure for Randomized Machine Learning

Mathematics. 2023. Vol. 11. No. 17. Article 3651.

Yuri S. Popkov, Дубнов Ю. А., Alexey Yu. Popkov

This paper is devoted to problem-oriented reinforcement methods for the numerical implementation of Randomized Machine Learning. We have developed a scheme of the reinforcement procedure based on the agent approach and Bellman’s optimality principle. This procedure ensures strictly monotonic properties of a sequence of local records in the iterative computational procedure of the learning process. The dependences of the dimensions of the neighborhood of the global minimum and the probability of its achievement on the parameters of the algorithm are determined. The convergence of the algorithm with the indicated probability to the neighborhood of the global minimum is proved.

Научное направление: Математика Компьютерные науки

Язык: английский

Полный текст

DOI

Текст на другом сайте

Ключевые слова: reinforcement learning Bellman’s optimality principle randomized machine learning

Local Fault-Tolerant Routing in 3D Mesh NoCs using Single-Hop Rollback

Edward R. Rzaev, Aleksandr Y. Romanov, Andrey M. Sukhov, IEEE Access 2026

Добавлено: 23 июля 2026 г.

Библиометрия фольклора: русские пословицы в научных журналах

Писляков В. В., Вестник Томского государственного университета. Филология 2026 № 101 С. 175–192

Исследуется использование паремий в статьях, опубликованных в отечественных научных журналах. В результате поиска по платформе eLIBRARY.RU и постатейного просмотра полных текстов формируется «паремический массив» – набор журнальных статей, вышедших за 2014–2023 гг., в которых встречается одна из десяти исследуемых пословиц. Выделяются только случаи, когда пословицы используются авторами как пришедшиеся к слову изречения, а не как ...

Добавлено: 22 июля 2026 г.

Long-range machine-learning potentials with environment-dependent charges enable predicting LO-TO splitting and dielectric constants

Korogod D., Shapeev A., Новиков И. С., Physical Review B: Condensed Matter and Materials Physics 2026 Vol. 114 No. 2 Article 024104

Добавлено: 22 июля 2026 г.

Global optimization of atomic clusters via physically constrained tensor train decomposition

Sozykin K., Rybin N., Chertkov A. и др., Physical Review B: Condensed Matter and Materials Physics 2026 Vol. 113 No. 22 Article 224111

Добавлено: 22 июля 2026 г.

Kolmogorov Operators and Their Applications

Singapore: Springer, 2024.

Добавлено: 17 июля 2026 г.

Existence and uniqueness results for strongly degenerate McKean-Vlasov equations with rough coefficients

Веретенников А. Ю., Pascucci A., Rondelli A., Stochastic Processes and their Applications 2026 Vol. 199 Article 104978

Добавлено: 17 июля 2026 г.

О сильных решениях многомерных СДУ с диагональными матрицами диффузии

Веретенников А. Ю., Ляппиева А. А., Теория вероятностей и ее применения 2026 Т. 71 № 2 С. 295–304

Установлен новый результат о сильной единственности для многомерного СДУ с невырожденной диффузией и частично нерегулярным сносом. Его можно рассматривать как комбинированный вариант на темы Ямада и Ватанабэ (1971), Звонкина (1974) и первого автора настоящей статьи (1980). ...

Добавлено: 17 июля 2026 г.

Об условиях для центральной предельной теоремы Добрушина для неоднородных цепей Маркова

Веретенников А. Ю., Нуриева А. И., Доклады Российской академии наук. Математика, информатика, процессы управления (ранее - Доклады Академии Наук. Математика) 2025 Т. 525 С. 24–30

Предложено новое достаточное условие в задаче о центральной предельной теореме в схеме серий для неоднородных цепей Маркова, с возможностью того, что минимум эргодического коэффициента Маркова–Добрушина может быть ближе к нулю, чем в основном условии Добрушина. ...

Добавлено: 17 июля 2026 г.

О частных производных модифицированных полиномов Бернштейна–Станку для функций нескольких переменных

Веретенников А. Ю., Мазутский Н. М., Математический сборник 2025 Т. 216 № 7 С. 3–27

Целью работы является доказательство аппроксимации смешанных производных второго порядка для функции нескольких переменных в норме L1 такими же производными модифицированных полиномов Бернштейна–Станку при минимальной возможной регулярности. ...

Добавлено: 17 июля 2026 г.

О законе больших чисел для неодинаково распределенных слабо зависимых слагаемых

Ахмярова А. Т., Веретенников А. Ю., Теория вероятностей и ее применения 2025 Т. 70 № 2 С. 211–227

В работе предложены новые версии слабого закона больших чисел (ЗБЧ) для слабо зависимых слагаемых (вообще говоря, разнораспределенных) как при наличии математического ожидания каждого из них, так и без такового. Одним из основных условий в первом из трех рассматриваемых случаев, в котором развиваются идеи из статьи Ю. Ш. Чау 1971 г., является равномерная интегрируемость слагаемых по Чезаро в духе работ по ЗБЧ для ...

Добавлено: 17 июля 2026 г.

On weak existence of solutions of degenerate McKean-Vlasov equations

Веретенников А. Ю., Stochastics and Dynamics 2024

Добавлено: 17 июля 2026 г.

Об усиленном законе больших чисел для попарно независимых случайных величин

Ахмярова А. Т., Веретенников А. Ю., Теория вероятностей и ее применения 2024 Т. 69 № 3 С. 427–438

Предложен новый вариант усиленного закона больших чисел для попарно независимых случайных величин. Основная цель — ослабить требование существования математического ожидания каждого из слагаемых. Предположение о попарной независимости также ослаблено. ...

Добавлено: 17 июля 2026 г.

On Higher Order Moments and Rates of Convergence for SDEs with Switching

Веретенников А. Ю., Moscow Mathematical Journal 2024 Vol. 24 No. 1 P. 107–124

Добавлено: 16 июля 2026 г.

On Positive Recurrence of the Mn/GI/1/∞ Model

Веретенников А. Ю., Mathematics 2023 Vol. 11 No. 21 Article 4514

Добавлено: 16 июля 2026 г.

On averaged expected cost control for 1D controlled ergodic diffusions with switching

Веретенников А. Ю., Markov Processes and Related Fields 2023 Vol. 23 No. 2 P. 259–294

Добавлено: 16 июля 2026 г.

WSI-GT: Pseudo-Label Guided Graph Transformer for Whole-Slide Histology

Михайлов И. А., Machine Learning and Knowledge Extraction 2026 Vol. 8 No. 1 Article 8

Whole-slide histology images (WSIs) can exceed 100 k × 100 k pixels, making direct pixel-level segmentation infeasible and requiring patch-level classification as a practical alternative for downstream WSI segmentation. However, most approaches either treat patches independently, ignoring spatial and biological context, or rely on deep graph models prone to oversmoothing and loss of local tissue ...

Добавлено: 16 июля 2026 г.

On recurrence, convergence and mixing rate for generalised Wright - Fisher's diffusion with mutation

Веретенников А. Ю., Sineokiy R., Markov Processes and Related Fields 2023 Vol. 23 No. 2 P. 241–258

Добавлено: 16 июля 2026 г.

Polynomial Recurrence for SDEs with a Gradient-Type Drift, Revisited

Веретенников А. Ю., Mathematics 2023 Vol. 11 No. 14 Article 3096

Добавлено: 16 июля 2026 г.

On the construction of Barnes–Wall lattices and their application in cryptography

Кунинец А. А., Малыгина Е. С., Leevik A. G. и др., Journal of Computer Virology and Hacking Techniques 2026 No. 22 Article 62

Добавлено: 16 июля 2026 г.

On functional equations for Chow polylogarithms

Болбачан В. С., / Series math "arxiv.org". 2024.

Полилогарифмы Чжоу — это специальные функции, возникающие при явном описании отображения регулятора Бейлинсона. Наиболее интересное функциональное уравнение для этой функции отражает тот факт, что она обращается в нуль на границе в комплексе циклов Блоха. Мы показываем, что это функциональное уравнение формально вытекает из более простых свойств: кососимметричности, функториальности и мультипликативности. Для доказательства этого мы рассматриваем ...

Добавлено: 16 июля 2026 г.

Разработка микросервиса ADP для идентификации источников выбросов на основе машинного обучения с подкреплением

Кычкин А. В., Черницин И. А., Прикладная информатика 2026 № 1(121) С. 40–58

Представлены результаты разработки программного микросервиса, встраиваемого в системы мониторинга качества атмосферного воздуха для поддержки процессов идентификации промышленных источников загрязнений. Выброс и последующее распространение вредных веществ в приземистых слоях атмосферы происходит в динамике и характеризуется высокой неопределенностью из‑за особенностей технологических установок, их режимов работы, влияния рельефа местности, зданий и метеофакторов. Зависимости между местоположением источника выброса и ...

Добавлено: 23 апреля 2026 г.

Artificial Neural Networks and Machine Learning. ICANN 2025 International Workshops and Special Sessions: 34th International Conference on Artificial Neural Networks, Kaunas, Lithuania, September 9–12, 2025, Proceedings, Part V

Cham: Springer, 2025.

Добавлено: 29 сентября 2025 г.

Analysis of a Company Model in Conditions of Unstable Demand Using Reinforcement Learning Methods

Delev A., Semakov S., , in: 2025 8th International Conference on Artificial Intelligence and Big Data (ICAIBD).: IEEE, 2025. P. 318–322.

Добавлено: 25 августа 2025 г.

Pseudo-collusion in a centralized algorithmic financial market

Пастушков А. В., Булатов А. Э., Finance Research Letters 2025 Vol. 83 Article 107671

Добавлено: 19 июня 2025 г.