?
О дистанционной занятости населения и ее детерминантах в современной России
Рассматривается проблема оценки масштабов дистанционной занятости в России и факторов, ее определяющих. Дистанционная занятость редко встречается в результатах даже масштабных выборочных наблюдений Росстата, что не позволяет использовать традиционный статистический инструментарий для ее оценки и изучения перспектив и потенциала развития. При малой вероятности наблюдаемого явления решение проблемы возможно с помощью балансировки данных, что позволяет использовать для моделирования редуцированный массив наблюдений без существенных информационных потерь. Балансировка обеспечивает сокращение численности преобладающей долей наблюдений до объема, равного числу наблюдений с альтернативным значением признака занятости. Предлагается подход, основанный на мэтчинге данных (подборе подобных по вероятности). Выбор признаков для организации подвыборок с альтернативными значениями характеристики дистанционной занятости обеспечивает возможность построения классификационных моделей, обладающих оптимальными характеристиками точности и полноты предсказания. Данный подход был применен для анализа дистанционной занятости на основе данных Обследования рабочей силы за 2023 г., что обеспечивает актуальность полученных результатов. Построенные модели логистической регрессии по сбалансированным данным позволили выявить значимые детерминанты нового формата занятости: занятость в сфере информационных технологий, наличие высшего образования, занятость в неформальном секторе экономики, принадлежность к женскому полу. Представлены направления и даны рекомендации для будущих исследований дистанционной занятости. Методика и результаты исследования могут быть полезны для решения широкого круга задач анализа и моделирования социально-экономических процессов и явлений по существенно несбалансированным выборкам.