• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • A
  • A
  • A
  • A
  • A
Обычная версия сайта
  • RU
  • EN
  • Национальный исследовательский университет «Высшая школа экономики»
  • Публикации ВШЭ
  • Статьи
  • Reinforcement Procedure for Randomized Machine Learning
  • RU
  • EN
Расширенный поиск
Высшая школа экономики
Национальный исследовательский университет
Приоритетные направления
  • бизнес-информатика
  • государственное и муниципальное управление
  • гуманитарные науки
  • инженерные науки
  • компьютерно-математическое
  • математика
  • менеджмент
  • право
  • социология
  • экономика
по году
  • 2027
  • 2026
  • 2025
  • 2024
  • 2023
  • 2022
  • 2021
  • 2020
  • 2019
  • 2018
  • 2017
  • 2016
  • 2015
  • 2014
  • 2013
  • 2012
  • 2011
  • 2010
  • 2009
  • 2008
  • 2007
  • 2006
  • 2005
  • 2004
  • 2003
  • 2002
  • 2001
  • 2000
  • 1999
  • 1998
  • 1997
  • 1996
  • 1995
  • 1994
  • 1993
  • 1992
  • 1991
  • 1990
  • 1989
  • 1988
  • 1987
  • 1986
  • 1985
  • 1984
  • 1983
  • 1982
  • 1981
  • 1980
  • 1979
  • 1978
  • 1977
  • 1976
  • 1975
  • 1974
  • 1973
  • 1972
  • 1971
  • 1970
  • 1969
  • 1968
  • 1967
  • 1966
  • 1965
  • 1964
  • 1963
  • 1958
  • еще
Тематика
Новости
29 июня 2026 г.
Город будущего и манифест для цифровых платформ: четвертый полуфинал «Научных боев» на ВДНХ
Темой нового полуфинала научных боев стал умный город. Участники доказывали: думать о будущем — значит разбираться в настоящем до мельчайших деталей. Четыре исследователя выступили с десятиминутными рассказами о своих научных работах перед жюри из преподавателей ВШЭ и зрительным залом. В центре внимания в этот раз оказались логистические драмы 1941 года, бактерии в кишечнике козы, карьерные ловушки для новичков и антикризисные стратегии биг-техов.
26 июня 2026 г.
«Культурологи пытаются увидеть, что скрывается за поверхностью обычных вещей»
Максим Жиганов много лет исследует разные стороны звука — сначала в привязке к своей родной Перми, а затем в более глобальных масштабах. В интервью проекту «Молодые ученые Вышки» он рассказал о звуковых картах, тематическом номере журнала «Логос» и о том, зачем делать привычное менее понятным и очевидным.
26 июня 2026 г.
В НИУ ВШЭ разработали приложение для диагностики фонологической обработки у детей
Специалисты Центра языка и мозга НИУ ВШЭ представили новый цифровой инструмент для оценки навыков фонологической обработки у детей — батарею тестов «ЗАРЯ» («Звуковой анализ русского языка»). Это первое в России стандартизированное приложение, позволяющее быстро и надежно выявлять нарушения способности различать звуки речи, удерживать их в оперативной памяти и проводить фонематический анализ. Программа работает на планшетах и смартфонах с операционной системой Android, доступна для скачивания в RuStore. Детали валидации теста опубликованы в Journal of Speech, Language, and Hearing Research.

 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!

Публикации
  • Книги
  • Статьи
  • Главы в книгах
  • Препринты
  • Верификация публикаций
  • Расширенный поиск
  • Правила использования материалов
  • Наука в ВШЭ

?

Reinforcement Procedure for Randomized Machine Learning

Mathematics. 2023. Vol. 11. No. 17. Article 3651.
Yuri S. Popkov, Дубнов Ю. А., Alexey Yu. Popkov

This paper is devoted to problem-oriented reinforcement methods for the numerical implementation of Randomized Machine Learning. We have developed a scheme of the reinforcement procedure based on the agent approach and Bellman’s optimality principle. This procedure ensures strictly monotonic properties of a sequence of local records in the iterative computational procedure of the learning process. The dependences of the dimensions of the neighborhood of the global minimum and the probability of its achievement on the parameters of the algorithm are determined. The convergence of the algorithm with the indicated probability to the neighborhood of the global minimum is proved.

Научное направление: Математика Компьютерные науки
Язык: английский
Полный текст
DOI
Текст на другом сайте
Ключевые слова: reinforcement learningBellman’s optimality principle randomized machine learning
Похожие публикации
Почти пустые симплексы и полиэдры Клейна
Герман О. Н., Илларионов А. А., Известия РАН. Серия математическая 2026 Т. 90 № 3 С. 3–18
Пусть симплекс с целочисленными вершинами - содержащий ровно одну целочисленную точку, отличную от своих вершин. В работе доказывается, что если точка находится во внутренности симплекса или в относительной внутренности некоторой гиперграни симплекса, то объем симплекса ограничен величиной, зависящей только от размерности, в противном случае объем симплекса может быть сколь угодно большим. Этот результат применяется для вывода асимптотической формулы для среднего числа вершин полиэдров ...
Добавлено: 29 июня 2026 г.
The 12th International Conference on Information Technology and Quantitative Management (ITQM 2025)
Netherlands: ScienceDirect, 2025.
Добавлено: 28 июня 2026 г.
Object-centric process management: A research manifesto
Seidel A., Weske M., Montali M. и др., Information Systems 2026 Vol. 141 Article 102728
Добавлено: 27 июня 2026 г.
2024 26th International Conference on Digital Signal Processing and its Applications (DSPA)
IEEE, 2024.
Добавлено: 27 июня 2026 г.
Построение методик оценки качества восприятия (QOE) потокового видео
Ивченко А. В., Дворкович А. В., Телекоммуникации 2020 Т. 12 С. 2–11
Технология Dynamic Adaptive Streaming over HTTP (DASH) обеспечивает работу большинства мультимедийных сервисов, ее особенности (повторные буферизации, переключения качества и др.) приводят к необходимости создания специализированных методик оценки пользовательского, субъективного качества восприятия Quality of Experience (QoE) на основе объективных параметров. В данной статье исследуется влияние различных метрик на QoE и приводятся модели оценки с коэффициентом корреляции ...
Добавлено: 27 июня 2026 г.
Generalized Hurst Hypothesis: Description of Time-Series in Communication Systems
Ивченко А. В., Nigmatullin R. R., Dorokhin S. V., Mathematics 2026 Vol. 9 No. 4 Article 381
В данной работе мы сосредоточимся на обобщении эмпирического закона Херста и предложим набор редуцированных параметров для количественного описания длительных временных рядов. Эти ряды обычно рассматриваются как специфический отклик сложной системы (экономической, геофизической, электромагнитной и других), где последовательная фиксация внешних факторов становится невозможной. Мы рассматриваем применение обобщенных законов Херста для получения нового набора редуцированных параметров в ...
Добавлено: 27 июня 2026 г.
Indicators of cosmonaut locomotor functions stability: A new method for ground-reaction forces analysis
Ивченко А. В., Шестопёров А. И., Фомина Е. В., Microgravity Science and Technology 2025 Vol. 37 No. 19 P. 1–19
Данная работа посвящена анализу медико-биологических данных, полученных в ходе локомоторных тестов космонавтов. Точная интерпретация данных играет решающую роль в мониторинге системы передвижения, профилактике негативных последствий длительного космического полета и, следовательно, в разработке автономной системы медицинского обеспечения для экспедиций в дальний космос. Во время локомоторных тестов космонавт меняет режимы движения в соответствии с предписанным протоколом тренировки, ...
Добавлено: 26 июня 2026 г.
Платформа, управляемая событиями, для интеграции компонентов машинного зрения с операционным центром.
Гаджимирзаев Ш. М., Хельвас А. В., 2023 3rd International Conference on Innovative Research in Applied Science, Engineering and Technology (IRASET) Mohammedia, Morocco 2023 P. 1–6
В статье предлагается архитектура событийно-управляемого Центра экстренного реагирования с компонентом компьютерного зрения. Анализируются источники информации и обсуждаются подходы к использованию событий компьютерного зрения для обнаружения и оценки тактических ситуаций. Сообщения от компонентов компьютерного зрения преобразуются в Протокол общих оповещений (Common Alerting Protocol) и обрабатываются средой Центра управления для распознавания тактических ситуаций. ...
Добавлено: 26 июня 2026 г.
Дискретное моделирование процесса восстановительного ремонта участка дороги
Гаджимирзаев Ш. М., Хельвас А. В., Компьютерные исследования и моделирование 2022 Т. 14 № 6 С. 1255–1268
абота содержит описание результатов моделирования процесса поддержания готовности участка дорожной сети в условиях воздействия с заданными параметрами. Рассматривается одномерный участок дороги длиной до 40 км с общим количеством ударов до 100 в течение рабочей смены бригады. Разработана имитационная модель проведения работ по его поддержанию в рабочем состоянии несколькими группами (инженерными бригадами), входящими в состав инженерно-дорожного ...
Добавлено: 26 июня 2026 г.
Подход к оценке динамики уровня консолидированности отрасли
Гаджимирзаев Ш. М., Хельвас А. В., Лукьянченко П. П., Computer Research and Modeling 2023 Vol. 15 No. 1 P. 129–140
В данной статье нами предложен новый подход к анализу эконометрических параметров отрасли для уровня консолидированности отрасли. Исследование базируется на простой модели управления отраслью в соответствии с моделью из теории автоматического управления. Состояние отрасли оценивается на основе ежеквартальных эконометрических параметров получаемых в обезличенном виде от каждой компании отрасли через налогового регулятора. Предложен подход к анализу отрасли, ...
Добавлено: 26 июня 2026 г.
Разработка микросервиса ADP для идентификации источников выбросов на основе машинного обучения с подкреплением
Кычкин А. В., Черницин И. А., Прикладная информатика 2026 № 1(121) С. 40–58
Представлены результаты разработки программного микросервиса, встраиваемого в системы мониторинга качества атмосферного воздуха для поддержки процессов идентификации промышленных источников загрязнений. Выброс и последующее распространение вредных веществ в приземистых слоях атмосферы происходит в динамике и характеризуется высокой неопределенностью из‑за особенностей технологических установок, их режимов работы, влияния рельефа местности, зданий и метеофакторов. Зависимости между местоположением источника выброса и ...
Добавлено: 23 апреля 2026 г.
Artificial Neural Networks and Machine Learning. ICANN 2025 International Workshops and Special Sessions: 34th International Conference on Artificial Neural Networks, Kaunas, Lithuania, September 9–12, 2025, Proceedings, Part V
Cham: Springer, 2025.
Добавлено: 29 сентября 2025 г.
Analysis of a Company Model in Conditions of Unstable Demand Using Reinforcement Learning Methods
Delev A., Semakov S., , in: 2025 8th International Conference on Artificial Intelligence and Big Data (ICAIBD).: IEEE, 2025. P. 318–322.
Добавлено: 25 августа 2025 г.
Pseudo-collusion in a centralized algorithmic financial market
Пастушков А. В., Булатов А. Э., Finance Research Letters 2025 Vol. 83 Article 107671
Добавлено: 19 июня 2025 г.
The beer game bullwhip effect mitigation: a deep reinforcement learning approach
Рожков М. И., Алямовская Н. С., Заходякин Г. В., International Journal of Production Research 2025 Vol. 63 No. 18 P. 6630–6647
Добавлено: 24 марта 2025 г.
Deep Reinforcement Learning-Based Congestion Control for File Transfer over QUIC
Blokhin A., Kalev V., Пусев Р. С. и др., , in: 2024 IEEE International Multi-Conference on Engineering, Computer and Information Sciences (SIBIRCON).: Novosibirsk: IEEE, 2024. P. 25–30.
Добавлено: 18 декабря 2024 г.
Generative Flow Networks as Entropy-Regularized RL
Тяпкин Д. Н., Морозов Н. В., Наумов А. А. и др., , in: Proceedings of The 27th International Conference on Artificial Intelligence and Statistics (AISTATS 2024), 2-4 May 2024, Palau de Congressos, Valencia, Spain. PMLR: Volume 238Vol. 238.: Valencia: PMLR, 2024. P. 4213–4221.
Добавлено: 22 июня 2024 г.
Model-free Posterior Sampling via Learning Rate Randomization
Тяпкин Д. Н., Беломестный Д. В., Calandriello D. и др., , in: Advances in Neural Information Processing Systems 36 (NeurIPS 2023).: Curran Associates, Inc., 2023. P. 73719–73774.
Добавлено: 17 февраля 2024 г.
Randomized Machine Learning Algorithms to Forecast the Evolution of Thermokarst Lakes Area in Permafrost Zones
Yu. A. Dubnov, A. Yu. Popkov, Polishchuk V. Y. и др., Automation and Remote Control 2023 Vol. 84 No. 1 P. 64–81
Рандомизированное машинное обучение ориентировано на задачи, сопровождаемые значительной неопределенностью в данных и моделях. Алгоритмы машинного обучения формулируются в терминах функциональной задачи энтропийно-линейного программирования. Рассматривается методика их адаптации к задачам прогнозирования на примере временной эволюции площади термокарстовых озер в зонах вечной мерзлоты, которые являются генераторами метана — одного из парниковых газов, влияющих на изменения климата. Предлагаются ...
Добавлено: 5 февраля 2024 г.
Fast Rates for Maximum Entropy Exploration
Тяпкин Д. Н., Беломестный Д. В., Calandriello D. и др., , in: Proceedings of the 40th International Conference on Machine Learning: Volume 202: International Conference on Machine Learning, 23-29 July 2023, Honolulu, Hawaii, USAVol. 202: International Conference on Machine Learning, 23-29 July 2023, Honolulu, Hawaii, USA.: PMLR, 2023. P. 34161–34221.
Добавлено: 1 декабря 2023 г.
Sharp Deviations Bounds for Dirichlet Weighted Sums with Application to analysis of Bayesian algorithms
Тяпкин Д. Н., Беломестный Д. В., Наумов А. А. и др., Working papers by Cornell University. Series math "arxiv.org" 2023 Article 2304.03056
In this work, we derive sharp non-asymptotic deviation bounds for weighted sums of Dirichlet random variables. These bounds are based on a novel integral representation of the density of a weighted Dirichlet sum. This representation allows us to obtain a Gaussian-like approximation for the sum distribution using geometry and complex analysis methods. Our results generalize ...
Добавлено: 28 июня 2023 г.
Variance Reduction for Policy-Gradient Methods via Empirical Variance Minimization
Беломестный Д. В., Каледин М. Л., Golubev A., /. 2022.
Добавлено: 14 апреля 2023 г.
A note on observational equivalence of micro assumptions on macro level
Пономаренко А. А., Economics: The Open-Access, Open-Assessment E-Journal 2020 Vol. 14 P. 1–15
The author set up a simplistic agent-based model where agents learn with reinforcement observing an incomplete set of variables. The model is employed to generate an artificial dataset that is used to estimate standard macro econometric models. The author shows that the results are qualitatively indistinguishable (in terms of the signs and significances of the ...
Добавлено: 28 марта 2023 г.
Ambiguous tDCS: variability of the transcranial direct current stimulation effects in a reinforcement learning task
Anastasia Grigoreva, Aleksei Gorin, Valeriy Klyuchnikov и др., Brain Stimulation 2023 Vol. 16 No. 1 P. 273
Добавлено: 1 марта 2023 г.
  • О ВЫШКЕ
  • Цифры и факты
  • Руководство и структура
  • Устойчивое развитие в НИУ ВШЭ
  • Преподаватели и сотрудники
  • Корпуса и общежития
  • Закупки
  • Обращения граждан в НИУ ВШЭ
  • Фонд целевого капитала
  • Противодействие коррупции
  • Сведения о доходах, расходах, об имуществе и обязательствах имущественного характера
  • Сведения об образовательной организации
  • Людям с ограниченными возможностями здоровья
  • Единая платежная страница
  • Работа в Вышке
  • ОБРАЗОВАНИЕ
  • Лицей
  • Довузовская подготовка
  • Олимпиады
  • Прием в бакалавриат
  • Вышка+
  • Прием в магистратуру
  • Аспирантура
  • Дополнительное образование
  • Центр развития карьеры
  • Бизнес-инкубатор ВШЭ
  • Образовательные партнерства
  • Обратная связь и взаимодействие с получателями услуг
  • НАУКА
  • Научные подразделения
  • Исследовательские проекты
  • Мониторинги
  • Диссертационные советы
  • Защиты диссертаций
  • Академическое развитие
  • Конкурсы и гранты
  • Внешние научно-информационные ресурсы
  • РЕСУРСЫ
  • Библиотека
  • Издательский дом ВШЭ
  • Книжный магазин «БукВышка»
  • Типография
  • Медиацентр
  • Журналы ВШЭ
  • Публикации
  • http://www.minobrnauki.gov.ru/
    Министерство науки и высшего образования РФ
  • https://edu.gov.ru/
    Министерство просвещения РФ
  • http://www.edu.ru
    Федеральный портал «Российское образование»
  • https://elearning.hse.ru/mooc
    Массовые открытые онлайн-курсы
  • НИУ ВШЭ1993–2026
  • Адреса и контакты
  • Условия использования материалов
  • Политика конфиденциальности
  • Правила применения рекомендательных технологий в НИУ ВШЭ
  • Карта сайта
Редактору