?
Сравнительный анализ методов прогнозирования банкротств российских строительных компаний
Работа посвящена сравнению способности различных моделей предсказывать банкротство компаний
строительной отрасли на горизонте в один год. Рассмотрены такие алгоритмы, как логит- и пробит-
модели, деревья классификации, случайные леса, искусственные нейронные сети. Особое внимание
уделено особенностям построения моделей машинного обучения, влиянию несбалансированности
данных на предиктивную способность моделей, анализу способов борьбы с несбалансированностью
данных, анализу влияния нефинансовых факторов на предиктивную способность моделей. В работе
использованы нефинансовые и финансовые показатели, рассчитанные на основе публичной финансовой
отчетности строительных компаний за период с 2011 по 2017 годы. Сделан вывод, что рассмотренные
алгоритмы показывают приемлемое качество для использования в задачах прогнозирования банкротств.
В качестве метрики качества моделей использовался коэффициент Джини или AUC (площадь под
ROC-кривой). Выявлено, что искусственные нейронные сети превосходят другие методы, в то время
как модели логистической регрессии в сочетании с дискретизацией вплотную следуют за ними.
Обнаружено, что эффективность способа преодоления несбалансированности данных зависит от типа
используемых моделей. В то же время значимого влияния несбалансированности обучающего множества
на предиктивную способность модели не выявлено. Существенное влияние нефинансовых показателей
на вероятность банкротства также не подтвердилось.