• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Глава

Detecting interethnic relations with the data from social media

P. 16-30.

Способность социальных медиа быстро распространять суждения пользователей об этничности и влиять на офлайновые этнические отношения создает потребность в методах автоматического мониторинга онлайн-контента, связанного с этнической принадлежностью. В этом исследовании мы измерили общий объем обсуждений в русскоязычных социальных медиа, связанных с этнической принадлежностью, и разработали подход, который автоматически определяразличные аспекты отношения к этим этническим группам. Для этого был создан обширный список этнонимов и связанных с ними биграмм, которые охватывают 97 постсоветских этнических групп, и собраны все тексты русскоязычных социальных медиа, содержащие хотябы одно слово из списка и написанные за двухлетний период с 2014 года (N = 2660222 текста). Мы вручную разметили 7181 сообщение, на основе чего обучили ряд классификаторов распознавать различные аспекты отношеня авторов к этничностям и другие особенности текстов. Оценив ряд стандартных показателей качества, мы сделали вывод, что достигли хорошего качества определения межгрупповых конфликтов, положительных межгрупповых контактов и общих негативных и позитивных настроений. В то же время, точность предсказаний относительно принадлежности текстов к этнической тематике и общего отношения к этнической группе оказалась наименьшей. Также некоторые аспекты, такие как призывы к насилию в отношении этнической группы, оказались недостаточно представлены в закодированных данных, что не позволило успешно находить тексты с этими признаками.