?
Variance Reduction for Policy-Gradient Methods via Empirical Variance Minimization
This paper is devoted to problem-oriented reinforcement methods for the numerical implementation of Randomized Machine Learning. We have developed a scheme of the reinforcement procedure based on the agent approach and Bellman’s optimality principle. This procedure ensures strictly monotonic properties of a sequence of local records in the iterative computational procedure of the learning process. ...
Добавлено: 5 февраля 2024 г.
Добавлено: 31 августа 2020 г.
Шпильман А. А., Никулин А. П., Proceedings of Machine Learning Research 2022 Vol. 176 P. 13-28
Добавлено: 10 октября 2023 г.
Гремячих Л. И., Dubov D., Казеев Н. А. и др., Advances in the Astronautical Sciences 2020 Vol. 170 P. 305-319
Добавлено: 10 октября 2019 г.
Гадецкий А. В., Струминский К. А., Robinson C. и др., / Bayesian Deep Learning NeurIPS 2019 Workshop. Series 2019 "Bayesian Deep Learning NeurIPS 2019 Workshop". 2019.
Добавлено: 9 января 2020 г.
Bobrov E., Kropotov Dmitry, Lu H. и др., IEEE Communications Letters 2022 Vol. 26 No. 4 P. 818-822
Добавлено: 26 октября 2022 г.
Беломестный Д. В., Мулине Э. Ф., Иосипой Л. С. и др., Statistics and Computing 2020 No. 30 P. 973-997
In this paper we propose a novel variance reduction approach for additive functionals of Markov chains based on minimization of an estimate for the asymptotic variance of these functionals over suitable classes of control variates. A distinctive feature of the proposed approach is its ability to significantly reduce the overall finite sample variance. This feature ...
Добавлено: 10 октября 2019 г.
Малышева А. И., PEROLAT J., VYLDER B. D., American Association for the Advancement of Science 378.6623 2022 Vol. 378 No. 6623 P. 990-996
Добавлено: 17 июня 2023 г.
Добавлено: 3 сентября 2018 г.
С. М. Авдошин, Г. А. Арутюнов, Информационные технологии 2022 Т. 28 № 7 С. 378-391
В условиях пандемии как никогда стала актуальной проблема нехватки кадров в сфере информационных технологий. По оценкам аналитиков в 2021 году Россия не досчиталась от 500 тыс. до 1 млн IT-специалистов. Образование и вывод на рынок такого большого числа специалистов может занять годы. Очень остро стоит вопрос оптимизации процесса создания IT-решений, в том числе путем разработки ...
Добавлено: 11 июня 2022 г.
Арзыматов К., Сапронов А. А., Белавин В. С. и др., PeerJ Computer Science 2020 P. 1-16
Добавлено: 9 октября 2019 г.
Белавин В. С., Устюжанин А. Е., Арзыматов К. и др., Advances in Systems Science and Applications 2018 Vol. 18 No. 4 P. 1-12
Добавлено: 2 февраля 2019 г.
Беломестный Д. В., Иосипой Л. С., Мулине Э. Ф. и др., SIAM-ASA Journal on Uncertainty Quantification 2021 Vol. 9 No. 2 P. 507-535
In this paper we propose a novel and practical variance reduction approach for additive functionals of dependent sequences. Our approach combines the use of control variates with the minimisation of an empirical variance estimate. We analyse finite sample properties of the proposed method and derive finite-time bounds of the excess asymptotic variance to zero. We ...
Добавлено: 18 августа 2020 г.
Belomestny Denis, Иосипой Л. С., Пари К. П. и др., Bernoulli: a journal of mathematical statistics and probability 2022 Vol. 28 No. 2 P. 1382-1407
Добавлено: 17 апреля 2022 г.
Карпов М. Е., Арзыматов К., Белавин В. С. и др., International Journal of Civil Engineering and Technology 2018 Vol. 9 No. 11 P. 220-226
Добавлено: 14 ноября 2019 г.
Тяпкин Д. Н., Беломестный Д. В., Наумов А. А. и др., Working papers by Cornell University. Series math "arxiv.org" 2023 Article 2304.03056
In this work, we derive sharp non-asymptotic deviation bounds for weighted sums of Dirichlet random variables. These bounds are based on a novel integral representation of the density of a weighted Dirichlet sum. This representation allows us to obtain a Gaussian-like approximation for the sum distribution using geometry and complex analysis methods. Our results generalize ...
Добавлено: 28 июня 2023 г.
Keramati M., Гуткин Б. С., eLife 2014 Vol. 2 No. 3
Efficient regulation of internal homeostasis and defending it against perturbations requires adaptive behavioral strategies. However, the computational principles mediating the interaction between homeostatic and associative learning processes remain undefined. Here we use a definition of primary rewards, as outcomes fulfilling physiological needs, to build a normative theory showing how learning motivated behaviors may be modulated ...
Добавлено: 19 декабря 2014 г.
Ружицкая Д. Д., САМОЙЛЕНКО А. А., Иванов А. Д. и др., Optoelectronics, Instrumentation and Data Processing 2017 Vol. 54 No. 1 P. 1-8
This paper presents an algorithm for processing the transmission spectra of whisperinggallery optical microcavities for use as a nanoparticle detector. The algorithm is based on the broadening of the microcavity resonance curve during precipitation of nanoparticles on the microcavity surface. Experimental results on the detection of particles are compared with Langmuir adsorption theory. The contribution ...
Добавлено: 25 мая 2018 г.
Беклемишев Л. Д., Оноприенко А. А., Математический сборник 2015 Т. 206 № 9 С. 3-20
Формулируются системы преобразований термов, число шагов работы которых на произвольном входе конечно, но не ограничивается никакой вычислимой функцией, доказуемо тотальной в арифметике Пеано PА. Тем самым, утверждение о сходимости таких систем не доказуемо в PA. Эти системы получаются из независимого комбинаторного утверждения, известного как принцип червя; их также можно рассматривать как вариант хорошо известной игры Геракла и гидры, ...
Добавлено: 13 марта 2016 г.
Borchmann D., Hanika T., Объедков С. А., Discrete Applied Mathematics 2020 Vol. 273 P. 30-42
Добавлено: 29 октября 2019 г.
Гостев И. М., М. : Юрайт, 2016
В настоящее время компьютерные науки стремительно развиваются. Новые версии операционных систем появляются каждые полтора-два года, поэтому было принято решение о включении в данную книгу такого материала, который не будет устаревать. Содержание учебника представляет собой некоторые наиболее общие принципы построения операционных систем, которые были разработаны более 50 лет назад и практически не изменились за прошедшее время. ...
Добавлено: 13 октября 2009 г.
Фурманов К. К., Nikol'skii I. M., Computational Mathematics and Modeling 2016 Vol. 27 No. 2 P. 247-253
Добавлено: 22 декабря 2016 г.
Литвин Ю. В., Абрамов И. В., Технологии техносферной безопасности 2016 № 66
Расширен подход к оценке случайного времени прибытия пожарных боевых расчётов на объект защиты, времени их занятости и свободного горения. Получены некоторые количественные оценки с использованием рассмотренных аналитических методов и имитации ...
Добавлено: 27 августа 2016 г.
Aaij R., Abdelmotteleb A. S., Abellan Beteta C. и др., The European Physical Journal C - Particles and Fields 2023 Vol. 83 Article 543
Добавлено: 4 декабря 2023 г.