?
Fairness of Machine Learning Algorithms in Demography
Emmanuel I. C., Митрофанова Е. С.
Работа посвящена изучению надежности моделей на российских данных методом предсказания наступления таких стартовых событий как: первый развод, первое трудоустройство и завершение образования. Наша цель состояла в том, чтобы сделать классификаторы более устойчивым, уменьшив погрешности при работе с сензитивными данными, увеличивая или по крайней мере поддерживая точность предсказаний.
Мы использовали нейронные методы «отсева» и модель «отсева признаков» для решения проблемы надежности. Чтобы оценить надежность классификатора и решить, какие сензитивные особенности нужно устранить, мы использовали «LIME Explanations». Для этих целей мы создали ансамбль классификаторов, в меньшей степени зависящих от сензитивных признаков и показывающих высокую точность.
Наше эмпирическое исследование было выполнено на четырех семействах классификаторов (Логистическая регрессия, случайные деревья решений, фасовка в Bagging и Adaboost) и реальном наборе данных (демографические данные по россиянам из обследования «Поколения и гендер»). Анализ показал, что все модели стали менее зависимы от сензитивных особенностей (таких как пол, завершение первого партнерства, первое партнерство и т.д.), а точность предсказаний стала выше.
Язык:
английский