• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Глава

Linis-crowd.org: лексический ресурс для анализа тональности социально-политических текстов на русском языке

С. 25-34.
Алексеева С. В., Кольцов С. Н., Кольцова О. Ю.

Автоматическая оценка тональности больших массивов текстов является важной задачей для социальных наук. В статье описываются методика и промежуточные результаты создания инструментов для такого анализа, а именно: общедоступного тонального словаря, общедоступной тестовой коллекции с разметкой и краудсорсингового веб-ресурса для разметки. Словарь создавался в два этапа. Сначала был сформирован прототип словаря эмоционально окрашенных слов, предназначенный для дальнейшей разметки добровольцами. Различные лингвистические источники и техники, использованные для этого, описываюстя в данной работе. Второй этап был посвящен формированию выборки текстов социально-политической направленности, относительно которых волонтеры определяют силу эмоциональной оценки отобранных слов; также размечаются и сами тексты. Разметка тональности осуществляется на ресурсе http://linis-crowd.org.