?
Прогнозирование доходности российских акций на основе анализа сентимента инвесторов в социальных сетях
В работе исследуется сентимент российских частных инвесторов в социальных сетях и его влияние на динамику доходности акций 78 компаний российского рынка в 2018-2022 г. Для учета сентимента при прогнозировании цен используется авторский индекс RSMI (Russian social media index), который строится на уникальной выборке сообщений из наиболее популярных у российских инвесторов социальных сетей - «Телеграм» и «Тинькофф Пульс». Индекс RSMI включает количественные (число публикаций в отношении каждой компании) и качественные (реакции инвесторов) характеристики, позволяющие определить реальное влияние той или иной публикации на инвесторов. С использованием индекса RSMI построены модели прогнозирования цен акций российских компаний методами регрессии «лассо» (lasso), «случайного леса», градиентного бустинга, экстремального градиентного бустинга, ансамблевого обучения и рекуррентной нейронной сети (LSTM). Показано, что для акций широкой выборки индикаторы технического анализа и рыночные мультипликаторы играют большую роль в построении прогнозов изменения доходности акций на часовых данных. Хотя добавление индекса сентимента и позволяет улучшить результаты прогнозирования доходности для акций широкой выборки, это не дает значительного улучшения предсказательной способности моделей и показывает разнонаправленные результаты. Наилучшие результаты добавление индекса сентимента в прогнозные модели показывает для топ-15 наиболее обсуждаемых российских компаний. Для отдельных моделей удалось добиться среднего снижения ошибок на 4,9%, а для отдельных компаний более чем на 10% уменьшить показатель ошибки MAE и на 20% MSE. Доказано, что на динамику доходности акций второго и третьего эшелона российского фондового рынка сентимент частных инвесторов на часовых данных не оказывает существенного влияния, а добавление индекса сентимента не позволяет улучшить результаты прогнозных моделей.