• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Глава

Выявление искаженной информации: подход с использованием дискурсивных связей

P. 23-32.
Galitsky B., Ilvovsky D.

Рассматривается лингвистический метод для выявления искаженной информации в тексте, основанный на анализе данных из сети и технологиях сравнения текстов. Делаются предположения относительно построения семейства алгоритмов генерации искаженных данных на основе оригинального текста. Также предлагается алгоритм, предназначенный для обнаружения искаженных данных. Алгоритм ищет фрагменты оригинального текста в сети и сравнивает их с потенциально искаженным фрагментом с помощью модели чащи разбора. Чаща разбора - это граф, объединяющий синтаксические деревья разбора и дискурсивные связи между ними. Работа предложенного алгоритма проверяется на наборе отзывов покупателей и реальных описаний товара, в результате чего демонстрируется применимость алгоритма к решению поставленной задачи.