?
Поиск закономерностей в индивидуальных демографических траекториях
В данной работе представлены результаты применения узорных структур (pattern structures) и “контрастных” закономер- ностей (emerging patterns) в анализе демографических последова- тельностей для данных по России. Панельные данные Российской части исследования GGS (Generation and Gender Survey) на основе трех волн опроса в 2004, 2007, и 2011 описывают 11 поколений ре- спондентов, начиная с 1930 по 1984. Основная задача заключалась в реализации методов для извлечения “контрастных” закономерно- стей (EP) при наличии дополнительных ограничений: полученные закономерности должны быть (замкнытыми) частыми неразрывны- ми префиксами входных последовательностей. Такие ограничения необходимы демографам для приемлемой интерпретации результа- тов и выявления событий на ранних этапах жизни, которые ведут к взрослению. Для удовлетворения ограничениям были применены FP-деревья3 на основе узорных структур и неразрывных префиксов. После извлечения EP, мы используем схему классификатора CAEP4для предсказания пола респондентов на основе их демографических последовательностей событий их ранней жизни. Лушчие результаты в терминах TPR-FPR кривых были получены для больших значений параметра минимального темпа роста (однако, некоторые респонден- ты остались неклассифицированы).