Выявление искаженной информации: подход с использованием дискурсивных связей

B. Galitsky; D. Ilvovsky

?

Выявление искаженной информации: подход с использованием дискурсивных связей

P. 23–32.

Рассматривается лингвистический метод для выявления искаженной информации в тексте, основанный на анализе данных из сети и технологиях сравнения текстов. Делаются предположения относительно построения семейства алгоритмов генерации искаженных данных на основе оригинального текста. Также предлагается алгоритм, предназначенный для обнаружения искаженных данных. Алгоритм ищет фрагменты оригинального текста в сети и сравнивает их с потенциально искаженным фрагментом с помощью модели чащи разбора. Чаща разбора - это граф, объединяющий синтаксические деревья разбора и дискурсивные связи между ними. Работа предложенного алгоритма проверяется на наборе отзывов покупателей и реальных описаний товара, в результате чего демонстрируется применимость алгоритма к решению поставленной задачи.

Язык: английский

Полный текст

Ключевые слова: web mining parse thicket чаща разбора

ПУБЛИКАЦИЯ ПОДГОТОВЛЕНА ПО РЕЗУЛЬТАТАМ ПРОЕКТА:

Майнинг сложноструктурированных данных и семантические технологии (2016)

В книге

Пятнадцатая национальная конференция по искусственному интеллекту с международным участием КИИ-2016 (3-7 октября 2016г., г.Смоленск, Россия): Труды конференции

Т. 1. , Смоленск: Универсум, 2016.

Интеллектуальный анализ текстов в логистике и управлении цепями поставок

Морозова Ю. А., Логистика и управление цепями поставок 2018 № 4 (87) С. 10–18

В настоящее время конкурентоспособность компании во многом зависит от того, насколько она использует возможности, которые дают современные информационные технологии. Интернет вещей, большие данные, блокчейн, технологии искусственного интеллекта - все это выводит компании на новый уровень взаимодействия и конкуренции, дает новые возможности построения логистических процессов, вносит свои коррективы в управление цепями поставок. Не секрет, что важным ...

Добавлено: 15 октября 2018 г.

12th International Summer School on Reasoning Web Summer School, RW 2016

[б.и.], 2017.

Добавлено: 18 сентября 2017 г.

Proceedings of the ISMW-FRUCT 2016

[б.и.], 2016.

Добавлено: 17 января 2017 г.

О проекте разработки системы мониторинга глобальных процессов на основе Интернет-новостей

Шаляева И. М., Ланин В. В., Лядова Л. Н., В кн.: Технологии разработки информационных систем - ТРИС-2016: материалы VII Международной научно-технической конференции. Том 1Т. 1.: Таганрог: Издательство ЮФУ, 2016. С. 166–170.

Описывается подход к анализу процессов на основе извлекаемых из новостных лент данных о событиях. Полученные данные обрабатываются средствами Process Mining, позволяющими построить формальные модели процессов. ...

Добавлено: 3 ноября 2016 г.

Text integrity assessment: Sentiment profile vs rhetoric structure

Galitsky B., Ильвовский Д. А., Kuznetsov S., , in: Computational Linguistics and Intelligent Text Processing. 16th International Conference, CICLing 2015, Cairo, Egypt, April 14-20, 2015, Proceedings, Part II.Vol. 9042.: Berlin: Springer, 2015. P. 126–139.

Добавлено: 7 ноября 2015 г.

Применение семантически связанных деревьев синтаксического разбора в задаче поиска ответов на вопросы, состоящие из нескольких предложений

Ильвовский Д. А., Научно-техническая информация. Серия 2: Информационные процессы и системы 2014 № 2 С. 28–37

Проблема нахождения релевантных ответов на вопросы, состоящие из нескольких предложений, является популярной и востребованной во многих прикладных областях. В частности, она возникает в промышленных системах, ориентированных на предоставление товаров и услуг. Один из основных подходов к данной проблеме заключается в том, что множество потенциальных ответов, полученное с помощью поиска по ключевым словам, повторно упорядочивается с ...

Добавлено: 9 июня 2014 г.

A Web Mining Tool for Assistance with Creative Writing

Галицкий Б. А., Кузнецов С. О., , in: Proc. 35th European Conference on Information Retrieval (ECIR 2013): Advances in Information RetrievalVol. 7814.: Springer, 2013. P. 828–831.

Добавлено: 18 ноября 2013 г.

Parse thicket representations of text paragraphs

Galitsky B., Ильвовский Д. А., Кузнецов С. О. и др., , in: Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной Международной конференции «Диалог» (Бекасово, 29 мая - 2 июня 2013 г.). В 2-х т.Т. 1: Основная программа конференции. Вып. 12 (19).: М.: РГГУ, 2013. P. 239–255.

Мы разрабатываем технику представления структуры предложений и абзацев текста в виде графов. Мы определяем чащу синтаксиче ского разбора как объединение синтаксических деревьев разбора предложений. Чаща включает дуги между вершинами синтаксических деревьев для таких отношений, как кореферентность и таксономия. Эти дуги также получаются из других источников, в том числе, тео рии Риторических Структур и Речевых Актов. В работе предлагается алгоритм вычисления чащ разбора. ...

Добавлено: 1 ноября 2013 г.

Diagnostic Test Approaches to Machine Learning and Commonsense Reasoning Systems

Найденова К., Игнатов Д. И., Hershey: IGI Global, 2012.

The consideration of symbolic machine learning algorithms as an entire class will make it possible, in the future, to generate algorithms, with the aid of some parameters, depending on the initial users’ requirements and the quality of solving targeted problems in domain applications. Diagnostic Test Approaches to Machine Learning and Commonsense Reasoning Systems surveys, analyzes, and ...

Добавлено: 3 декабря 2012 г.