• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Глава

Parse thicket representations of text paragraphs

P. 239-255.

Мы разрабатываем технику представления структуры предложений
и абзацев текста в виде графов. Мы определяем чащу синтаксиче-
ского разбора как объединение синтаксических деревьев разбора
предложений. Чаща включает дуги между вершинами синтаксических
деревьев для таких отношений, как кореферентность и таксономия.
Эти дуги также получаются из других источников, в том числе, тео-
рии Риторических Структур и Речевых Актов. В работе предлагается
алгоритм вычисления чащ разбора. Также в работе рассматриваются
программные средства, предназначенные для построения чащ раз-
бора и выполнения операции обобщения (пересечения) чащ разбора.
На основе рассматриваемого подхода проводятся вычислительные
эксперименты по улучшению поиска в случае, когда запрос представ-
лен несколькими предложениями. Производится сравнение базового
поиска, поиска с помощью сопоставления отдельных предложений
и поиска с использованием Чащ разбора.