Глава
Моделирование успешности выполнения заданий ЕГЭ по математике. Методика и некотрые результаты. (Макаров А.А., Симонова Г.И.)
Рассмотрена методика моделирования успешности выполнения учащимися заданий ЕГЭ по математике на данных ЕГЭ по математике за 2011 г. Для отдельных заданий ЕГЭ выделены значимые предикторы и построены модели бинарной логистической и порядковой регрессий, предсказывающие вероятность выполнения задания.
В книге
В данной работе представляется подход, основанный на CHAID, для определения гетерогенности точности классификации между сегментами наблюдений. Он помогает решить некоторые важные проблемы, стоящие перед человеком, строящим модель: (1) Как автоматически определять сегменты, в которых модель существенно хуже работает? и (2) Как использовать знание о гетерогенности точности классификации между сегментами для разделения наблюдений с целью получения большей точности предсказания? Подход был применен к данным по уходу клиентов из архива данных UCI Repository of Machine Learning Databases. Посредством разбиения набора данных на четыре части, которые были получены на основании использования дерева классификации, и построения отдельных логистических регрессионных скоринговых моделей для каждого сегмента мы повысили точность более чем на 7 процентных пунктов на тестовой выборке. Также наблюдалось существенное повышение в показателях recall и precision. Было показано, что в различных сегментах могут быть абсолютно разные предикторы ухода клиентов. Поэтому такое разделение дает лучшее понимание факторов, влияющих на поведение потребителей.
Рассматривается методика сравнительного анализа кластеризации дискретных распределений на разных шкалах и ее результаты на примере анализа результатов ЕГЭ по математике в 2009-2010 гг. Показано, что смена формата ЕГЭ по математике изменила форму общефедерального распределения, сократила число разнородных кластеров и уменьшила различия между ними.
Сборник содержит варианты вступительных испытаний по математике, предлагавшиеся в ГУ-ВШЭ в 2001 – 2006 гг. Каждый вариант включает 30 задач по всем разделам школьной программы, кроме стереометрии, и рассчитан на 90 минут. В части 2 представлены варианты третьего (c) уровня сложности. Для каждой задачи предлагается 5 вариантов ответа. В конце сборника приведены правильные ответы.
Для школьников и абитуриентов, готовящихся к ЕГЭ по математике.
Лимит, устанавливаемый на аукционе РЕПО с Банком России, а также величина спроса на этом аукционе формируют один из важных сигналов на рынке межбанковского кредитования. Для того чтобы подавать верный сигнал рынку, регулятор должен иметь надежный инструмент оценки спроса. В данной работе предлагается подход к получению такого инструмента, который на основе комбинации логистической и линейной регрессий способен воспроизводить особенности спроса на аукционе РЕПО.
В статье продемонстрировано, как авторский подход к повышению точности логистической регрессии может быть применен к моделированию вероятности ухода абонентов сотового оператора. Особенностью получаемого результата является учет неодинакового влияния факторов, повышающих склонность к смене оператора, на представителей разных сегментов абонентской базы.
Проведен сравнительный анализ состояния рынка услуг связи в России, европейских государствах и других странах мира. На базе многомерных статистических методов определены характерные черты российского рынка услуг связи. С помощью аппарата логистической регрессии выявлены факторы, оказывающие значимое влияние на развитие региональных рынков услуг связи в России
В основу книги положены материалы курса лекций и спецкурсов, читавшихся авторами в течение ряда лет на факультете «Прикладной математики» в Московском институте электроники и математики и в Институте криптографии, связи и информатики Академии ФСБ России. Представленный в ней материал полностью обеспечивает программу по математической статистике учебного плана ГОС по специальности «Прикладная математика». Изложение материала ведется на уровне, доступном студентам технических вузов; для его понимания достаточно знания основ классического математического анализа, линейной алгебры и теории вероятностей, читаемых на начальных семестрах вузовской программы по математике.
Излагаются основные элементы современной статистической теории; акцент делается на исследование вопросов оптимальности соответствующих статистических процедур и их практической реализации с использованием компьютерной техники. Все разделы книги снабжены задачами. Материал книги может быть использован для формирования специальных курсов по математической статистике, индивидуальной работы со студентами и самообразования. Книга может быть полезна также студентам университетов естественных специальностей, аспирантам и научным работникам, применяющим в своих исследованиях вероятностные и статистические методы.