?
Использование машинного обучения и классических статистических методов для построения скоринговой модели в автостраховании
В автостраховании актуальна проблема финансовых убытков, вызванных неверной
классификацией клиентов с точки зрения возможной убыточности договора страхования с
ними. Работа направлена на разработку скоринговой системы на основе методов машинного
обучения и статистики, использующей данные портфеля крупной страховой компании (более
30000 наблюдений). Цель – выявление переменных, предсказывающих надёжность клиента, и
сравнение различных методов: градиентного бустинга, случайного леса, логистической ре-
грессии, нейросетей. Применялись методы предобработки (заполнение пропусков, кодирова-
ние категориальных признаков, нормализация). Для оценки моделей использовались точность,
F1-мера, ROC-кривые, матрицы ошибок. Рассмотрены интерпретация моделей с помощью
векторов Шепли и влияние новых методов кодирования признаков на качество и интерпрети-
руемость. Анализ показал, что машинное обучение значительно повышает эффективность ан-
деррайтинга, снижает риски и способствует лучшей селекции рисков и снижению стоимости
полисов. Работа вносит вклад в развитие скоринговых систем, объединяющих современные
подходы анализа данных, и предлагает практические инструменты для снижения убыточно-
сти, повышения финансовой устойчивости страховых компаний и роста доверия клиентов.