?
Исследование лаговой структуры индексов Google Trends в задаче прогнозирования миграции из России
Миграция населения существенным образом влияет на демографические, экономические, социальные и иные показатели страны выбытия и прибытия. Показатели миграции подвержены внешним шокам, таким как эпидемии, военные действия, природные катаклизмы и др. Однако сложность сбора такой статистики, отсутствие достоверных данных, а также предоставление данных о миграции с временной задержкой затрудняют такие оценки. В литературе развивается целое направление, связанное с оценками миграционных потоков как внутри страны, так и за ее пределы, на основе альтернативных источников данных (Вакуленко, Цимайло, 2011; Чудиновских, 2018; Чудиновских, 2020).
Цель данной работы - краткосрочное прогнозирование внешней миграции (наукастинг) с использованием данных поисковых запросов Google Trends Indeх (GTI), опережающие данные, публикуемые официальными статистическими службами. Такой подход уже ранее применялся для прогнозирования миграции как внутренней, так и внешней, в том числе и в России (Fantazzini et al., 2021; Цапенко, Юревич, 2022; Броницкий, Вакуленко, 2022). В этих работах рассматриваются модели временных рядов (типа SARIMAX) с зависимой переменной — миграционный поток, а в числе объясняющих рассматриваются GTI для определенных поисковых запросов, которые, как правило, определяются экспертно. Мы предлагаем усовершенствование методологии прогнозирования миграции с помощью GTI в двух направлениях: во первых, предлагаем подход подбора ключевых поисковых запросов и агрегирования их на основании различных статистических критериев, демонстрируем их работоспособность и приводим аргументы в пользу выбора одного из них; во-вторых, мы демонстрируем важность включения в модели миграции временной лаговой структуры поисковых запросов в зависимости от целей миграции и связанных с ними GTI.