?
Выявление искаженной информации: подход с использованием дискурсивных связей
Рассматривается лингвистический метод для выявления искаженной информации в тексте, основанный на анализе данных из сети и технологиях сравнения текстов. Делаются предположения относительно построения семейства алгоритмов генерации искаженных данных на основе оригинального текста. Также предлагается алгоритм, предназначенный для обнаружения искаженных данных. Алгоритм ищет фрагменты оригинального текста в сети и сравнивает их с потенциально искаженным фрагментом с помощью модели чащи разбора. Чаща разбора - это граф, объединяющий синтаксические деревья разбора и дискурсивные связи между ними. Работа предложенного алгоритма проверяется на наборе отзывов покупателей и реальных описаний товара, в результате чего демонстрируется применимость алгоритма к решению поставленной задачи.