Статья
Minimax adaptive dimension reduction for regression
В машинном обучении при построении регрессионных зависимостей или решении задач классификации многомерные описания объектов часто являются избыточными и функционально зависимыми. Такие описания зачастую лежат около многообразий существенно меньшей размерности, чем размерность их первичной записи. Данное предположение называется гипотезой многообразия (Manifold Hypothesis). Использование такой информации может помочь в решении исходной задачи. Так возникает задача оценивания многообразий. В последние годы был разработан ряд подходов, таких как изометрическое отображение (Isomap), локально-линейное вложение (LLE), выравнивания локальных тангенциальных пространств (LTSA) и спектральных вложений Грассмана-Штифеля (GSE), для решения данной задачи. В работе рассмотрена общая схема подобных алгоритмов. Одним из их шагов является расширения отображения сжатия на точки вне заданной выборки. Однако, для таких отображений необходимо задавать область определения, так как многообразие неизвестно. Для алгоритма Грассмана-Штифеля доказано, что область определения сходится по расстоянию Хаусдорфа по вероятности к неизвестному многообразию.
Based on n randomly drawn vectors in a Hilbert space, we study the k-means clustering scheme. Here, clustering is performed by computing the Voronoi partition associated with centers that minimize an empirical criterion, called distorsion. The performance of the method is evaluated by comparing the theoretical distorsion of empirical optimal centers to the theoretical optimal distorsion. Our first result states that, provided that the underlying distribution satisfies an exponential moment condition, an upper bound for the above performance criterion isO(1/n√). Then, motivated by a broad range of applications, we focus on the case where the data are real-valued random fields. Assuming that they share a Hölder property in quadratic mean, we construct a numerically simple k-means algorithm based on a discretized version of the data. With a judicious choice of the discretization, we prove that the performance of this algorithm matches the performance of the classical algorithm.
В первой части пособия рассмотрены дополнительные вопросы теории вероятностей, необходимые для изучения математической статистики, и начальные сведения по математической статистике.
Во второй части пособия подробно изложены вопросы, связанные с решением одной из основных задач математической статистики - параметрической задачи. Приведено много примеров.
Рекомендуется всем студентам МИЭМа, изучающим математическую статистику.
Центр конъюнктурных исследований Института статистических исследований и экономики знаний НИУ ВШЭ представляет информационно-аналитический материал «Деловой климат в оптовой торговле в I квартале 2012 года», подготовленный в рамках Программы фундаментальных исследований НИУ ВШЭ на основе ежеквартальных конъюнктурных опросов руководителей около 3 тыс. торговых компаний, проводимых Федеральной службой государственной статистики.
Конъюнктурные обследования направлены на оперативное получение от предпринимателей в дополнение к официальным статистическим данным краткосрочных качественных оценок о состоянии бизнеса и основных тенденциях его динамики, особенностях функционирования хозяйствующих субъектов, их намерениях, степени адаптации к механизмам хозяйствования, сложившемся деловом климате, а также о важнейших факторах, лимитирующих их деятельность.
Программа обследования гармонизирована с соответствующими подходами, принятыми в странах ОЭСР, и базируется на Гармонизированной Европейской Системе обследований деловых тенденций.
Структура выборочной совокупности идентична структуре генеральной статистической совокупности. При этом объем выборки достаточен для получения необходимой точности оценок показателей на всех уровнях разработки по разделу ОКВЭД (раздел G).
Настоящая книга представляет собой своеобразный расширенный учебник по математической статистике. Данный учебник не ограничен рамками учебного стандарта или вузовской программы --- он предназначен всем, кто интересуется математикой вообще и, в частности, хочет узнать, что такое современная математическая статистика, какие задачи и какими методами она решает, какие результаты в ней уже накоплены, какие проблемы в ней сегодня актуальны; наконец, каковы ее истоки, какой путь она прошла и какие ученые были ее творцами. По замыслу авторов, книга простым и доступным языком рассказывает о математической статистике и одновременно обучает ей. Вся теория объясняется и иллюстрируется на интересных и тщательно подобранных примерах. Книга может служить и задачником, так как содержит большой список упражнений для самостоятельного решения, а также справочным пособием по математической статистике, а в некоторых аспектах --- и по теории вероятностей.
Книга будет интересна преподавателям, аспирантам и студентам естественных и технических вузов, в которых изучается математическая статистика, научным работникам, использующим в своей деятельности методы математической статистики, а также самому широкому кругу любителей математики.
Изучаются класс задач оптимального управления и порожденные ими гамильтоновы системы в пространстве l 2. Доказывается существование экстремалей со счетным числом переключений на конечном интервале времени. Построен оптимальный синтез в пространстве l 2, образующий расслоение с кусочно-гладкими двумерными слоями, состоящими из экстремалей со счетным числом переключений, над бесконечномерной базой особых экстремалей.
Изучается задача минимизации среднеквадратичного отклонения однородной струны с закрепленными концами от положения равновесия. Управлением служит плотность внешних сил, действующих на струну. Предполагается, что заданы начальные условия и концы струны закреплены. Используется метод Фурье, который позволяет задачу управления уравнением в частных производных свести к задаче управления счетной системой обыкновенных дифференциальных уравнений. Для полученной задачи оптимального управления в пространстве l2 доказано, что оптимальный синтез содержит особые траектории и траектории с учащающимися переключениями. Для исходной задачи оптимального управления колебаниями струны доказано, что существует единственное решение, при этом оптимальное управление имеет счетное число переключений на конечном интервале времени.
В данной работе рассматривается пятое уравнение Пенлеве, которое имеет 4 комплексных параметра α, β, γ, δ. Методами степенной геометрии ищутся асимптотические разложения его решений при x → ∞. При α≠0 найдено 10 степенных разложений с двумя экспоненциальными добавками каждое. Шесть из них - по целым степеням x (они были известны), и четыре по полуцелым (они новые). При α=0 найдено 4 однопараметрических семейства экспоненциальных асимптотик y(x) и 3 однопараметрических семейства сложных разложений x=x(y). Все экспоненциальные добавки, экспоненциальные асимптотики и сложные разложения найдены впервые. Также уточнена техника вычисления экспоненциальных добавок.
Эта публикация представляет собой сборник отдельных статей "Третьей Международной конференции по динамике информационных систем», которая состоялась в университете Флориды, 16-18 февраля 2011 года. Цель данной конференции заключалась в том, чтобы собрать вместе ученых и инженеров из промышленности, правительства и научных кругов, чтобы они смогли обменяться новыми открытиями и результатами в вопросах, имеющих отношение к теории и практике динамики информационных систем. Динамика информационных систем: математическое открытие представляет собой современное исследование и предназначается студентам – аспирантам и исследователям, которые интересуются самыми последними открытиями в информационной теории и динамичных системах. Ученые других дисциплин могут также получить пользу от применения новых разработок в своих областях исследований.
В работе построено новое распределение, отвечающее реальному благородному газу, а также уравнение состояний для него.
Статьи данного сборника написаны на основе докладов, сделанных в 2011 г. на социологическом факультете МГУ им. М.В. Ломоносова на заседании XIV Междисциплинарного ежегодного научного семинара "Математическое моделирование социальных процессов" им. Героя Социалистического труда академика А.А. Самарского.
Издание предназначено для научных сотрудников, преподавателей, учащихся вузов и научных учреждений РАН, интересующихся проблемами, разработкой и внедрением методологии математического моделирования социальных процессов.