?
Методы математической статистики и алгоритмы обработки больших данных в инструменте объективного измерения уровня привлекательности розничной цены – «Ценометр» мобильного приложения «Покупайка»
«Покупайка» – это агрегатор цен розничной торговли, реализованный в виде мобильного приложения на платформах iOS и Android. Одной из главных функций системы является оценка привлекательности рыночных предложений для покупателя. Мы считаем предложение привлекательным (выгодным), если предлагаемая цена ниже, чем среднее значение по региону, с учетом текущего местоположения пользователя. В зависимости от разницы между заданным и среднестатистическим значением цены на товар, мы относим предложение к одной из нескольких ценовых категорий, имеющих визуальную репрезентацию в приложении. Таким образом, для измерения степени привлекательности предложений нам необходимо рассчитывать определенные агрегатные показатели, описывающие распределение цен на рынке в разрезе товаров и регионов, и своевременно обновлять эти показатели по мере поступления новых данных в систему.
Количество товарных позиций, представленных в магазине средней величины, составляет порядка 5-6 тысяч. В крупных же супермаркетах ассортимент товаров нередко исчисляется десятками тысяч позиций. Количество магазинов средней величины на территории Российской Федерации может находиться в пределах от 50 до 100 тысяч, и супермаркетов – от 1 до 4 тысяч соответственно. По нашим оценкам, полное обновление цен в торговой точке происходит не реже, чем раз в месяц. При этом, цены на отдельные категории наиболее востребованных товаров могут меняться раз в неделю и даже чаще, благодаря повсеместному распространению таких маркетинговых инструментов, как скидки, программы лояльности, “акции” с ограниченным сроком действия, и т.п. Таким образом, грубая нижняя оценка общего количества предложений на товары повседневного спроса составляет порядка 500 миллионов в месяц, или 6 миллиардов предложений в год.
При таких объемах исходных данных, разработка инкрементальных алгоритмов расчета аналитических показателей и поиск наиболее эффективных путей для их реализации с учетом эксплуатационных особенностей современных технологических платформ, становится критически важным.