Improved High-Probability Bounds for the Temporal Difference Learning Algorithm via Exponential Stability

S. Samsonov; D. Tiapkin; A. Naumov; E. Moulines

АБВ
АБВ
АБВ

Обычная версия сайта

Приоритетные направления

по году

Тематика

Новости

5 июня 2026 г.

Аспирантка НИУ ВШЭ открыла «невидимую» планировку античного Париона

Исследовательница из НИУ ВШЭ Идиль Малгиль изучила с помощью дрона с лазерным сканером сверхвысокого разрешения древнеримский город Парион, расположенный на территории современной Турции. Благодаря высокой плотности сканирования удалось зафиксировать крошечные неровности рельефа, скрытые под землей и растительностью. Обнаружены следы целых кварталов, террасных систем и стен, которые невозможно было различить ни при обычных раскопках, ни с помощью аэрофотосъемки. Результаты исследованияо публикованы в международном научном журнале Ancient Civilizations from Scythia to Siberia.

2 июня 2026 г.

От Волги до Янцзы: математики из Нижнего Новгорода и Шанхая изучают устойчивость систем

Математики НИУ ВШЭ в Нижнем Новгороде совместно с коллегами из шанхайского Университета Тунцзи исследуют фундаментальные причины структурной устойчивости систем и механизмы их нарушения. О развитии проекта Qualitative Theory of Systems of Ordinary and Partial Differential Equations в рамках программы НИУ ВШЭ «Международное академическое сотрудничество» «Вышке.Главное» рассказала его руководитель, профессор Ольга Починка, заведующая Международной лабораторией динамических систем и приложений НИУ ВШЭ в Нижнем Новгороде.

4 июня 2026 г.

«Я хочу, чтобы люди больше доверяли науке»

Выбирая специальность «фундаментальная и прикладная лингвистика», Татьяна Еремичева думала, что это про изучение языков, а оказалось — про помощь людям. В интервью проекту «Молодые ученые Вышки» она рассказала о науке как инструменте приятия этого мира, бильярде как варианте тимбилдинга и о том, как иногда непросто научиться читать.

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!

Публикации

?

Improved High-Probability Bounds for the Temporal Difference Learning Algorithm via Exponential Stability

Ch. 247. P. 4511–4547.

Самсонов С. В., Тяпкин Д. Н., Наумов А. А., Мулине Э. Ф.

Язык: английский

Текст на другом сайте

Ключевые слова: GTD learning linear stochastic approximation стохастическая аппроксимация Random matrix products

ПУБЛИКАЦИЯ ПОДГОТОВЛЕНА ПО РЕЗУЛЬТАТАМ ПРОЕКТА:

Разработка и теоретический анализ новых эффективных стохастических алгоритмов машинного обучения (2024)

В книге

Proceedings of Machine Learning Research. Volume 247: The Thirty Seventh Annual Conference on Learning Theory, 30-3 July 2023, Edmonton, Canada

PMLR, 2024.

High-Order Error Bounds for Markovian LSA with Richardson–Romberg Extrapolation

Левин И. В., Наумов А. А., Самсонов С. В., , in: Proceedings of the AAAI Conference on Artificial Intelligence. AAAI-26: AAAI Technical Track on Planning, Routing, and Scheduling; AAAI Technical Track on Reasoning under Uncertainty; AAAI Technical Track on Search and Optimization. Main Track, volume 40 no. 43.: American Association for Artificial Intelligence (AAAI) Press, 2026. P. 36696–36704.

Добавлено: 17 апреля 2026 г.

SCAFFLSA: Taming Heterogeneity in Federated Linear Stochastic Approximation and TD Learning

Mangold P., Самсонов С. В., Labbi S. и др., , in: 38th Conference on Neural Information Processing Systems (NeurIPS 2024).: [б.и.], 2024. Ch. 37 P. 13927–13981.

Добавлено: 11 февраля 2025 г.

Finite-Time High-Probability Bounds for Polyak–Ruppert Averaged Iterates of Linear Stochastic Approximation

Durmus A., Мулине Э. Ф., Наумов А. А. и др., Mathematics of Operations Research 2025 Vol. 50 No. 2 P. 935–964

Добавлено: 13 июля 2022 г.

Tight High Probability Bounds for Linear Stochastic Approximation with Fixed Stepsize

Durmus A., Мулине Э. Ф., Наумов А. А. и др., , in: Advances in Neural Information Processing Systems 34 (NeurIPS 2021).: Curran Associates, Inc., 2021. P. 30063–30074.

This paper provides a non-asymptotic analysis of linear stochastic approximation (LSA) algorithms with fixed stepsize. This family of methods arises in many machine learning tasks and is used to obtain approximate solutions of a linear system $\bar{A}\theta = \bar{b}$ for which $\bar{A}$ and $\bar{b}$ can only be accessed through random estimates $\{({\bf A}_n, {\bf b}_n): ...

Добавлено: 17 февраля 2022 г.

On the Stability of Random Matrix Product with Markovian Noise: Application to Linear Stochastic Approximation and TD Learning

Durmus A., Мулине Э. Ф., Наумов А. А. и др., , in: Proceedings of Machine Learning ResearchVol. 134: Conference on Learning Theory.: PMLR, 2021. P. 1711–1752.

Добавлено: 6 августа 2021 г.

Finite Time Analysis of Linear Two-timescale Stochastic Approximation with Markovian Noise

Каледин М. Л., Мулине Э. Ф., Наумов А. А. и др., , in: Proceedings of Machine Learning ResearchVol. 125: Proceedings of Thirty Third Conference on Learning Theory.: [б.и.], 2020. P. 2144–2203.

Добавлено: 30 июля 2020 г.