?
Анализ редких событий: логистическая регрессия и альтернативы
Революции всегда вызывали интерес социологов и политологов, однако только в последнее десятилетие авторы начали активно использовать количественные методы для их анализа. В таких исследованиях зависимая переменная, революции или ее характеристики, часто представляет собой «редкие события». Некоторыми авторами было показано, что логистическая регрессия – самый используемый метод – дает смещенные результаты при анализе таких данных, однако единого стандарта для анализа так и не было выработано. Более того, часто авторы сталкиваются и с другими сопутствующими проблемами – панельными данными и малой выборкой. При этом надежность классической логистической регрессии при сочетании этих проблем еще не была проверена, хотя бо́ льшая часть современных авторов сталкивается именно с их пересечением. В рамках настоящего исследования мы постарались оценить, как использование логистической регрессии при разных исследовательских дизайнах с редкими событиями – в случае кросс-секционных и панельных данных – влияет на смещенность и устойчивость результатов. Также мы предлагаем альтернативу – логистическую регрессию со штрафом. Мы нашли, что в случае с кросс-секционными данными сочетание малой выборки и редкого события порождает огромное смещение в классической логистической регрессии, и исследователь рискует не только не получить относительно точной оценки эффекта, но и сделать абсолютное ложное суждение о направлении связи. В свою очередь, логистическая регрессия со штрафом дает почти что несмещенные оценки при любой редкости события и даже при очень малой выборке. В случае с панельными данными классическая логистическая регрессия в ситуации малой выборки и редких событий не применима вовсе. На удивление, логистическая регрессия со штрафом решает все эти проблемы – панельные данные, малая выборка и редкость события. На наш взгляд, это самое важное наблюдение настоящей работы: логистическая регрессия со штрафом отлично справляется с панельными данными, тогда как в профессиональной литературе единственной опцией считается условная логистическая регрессия.