Parse Thicket Representation for Multi-sentence Search

B. Galitsky; S. Kuznetsov; Usikov D.

АБВ
АБВ
АБВ

Обычная версия сайта

Приоритетные направления

по году

Тематика

Новости

28 июля 2026 г.

Ученые выяснили, почему во время COVID-19 одни носили маски, а другие - нет

Почему одни люди добровольно следуют новым правилам, а другие их игнорируют? Ученые НИУ ВШЭ выяснили, что дело не столько в готовности действовать сообща, как считалось раньше, сколько в способности сопереживать другим людям. Именно эмпатия лучше всего объяснила, почему во время пандемии COVID-19 одни люди носили маски добровольно, а другие — нет. Результаты исследования опубликованы в журнале Frontiers.

27 июля 2026 г.

Ускорение, точность и самокоррекция: ученые ФКН ВШЭ на международной конференции ICML-2026

Исследователи факультета компьютерных наук (ФКН) ВШЭ представили свои проекты в южнокорейском Сеуле на международной конференции по машинному обучению ICML 2026, одном из главных научных событий в своей области. Сразу несколько исследований сотрудников факультета были удостоены высокого статуса Spotlight .

27 июля 2026 г.

«Конференция усилила ощущение причастности к международному математическому сообществу»

С 13 по 17 июля на факультете математики НИУ ВШЭ прошла международная конференция «Модули, динамика и интегрируемость». Ее участниками стали известные ученые из России, США, Китая, Великобритании и других стран.

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!

Публикации

?

Parse Thicket Representation for Multi-sentence Search

P. 153–172.

Галицкий Б. А., Кузнецов С. О., Usikov D.

We develop a graph representation and learning technique for parse structures for sentences and paragraphs of text. This technique is used to improve relevance answering complex questions where an answer is included in multiple sentences. We introduce Parse Thicket as a sum of syntactic parse trees augmented by a number of arcs for inter-sentence word-word relations such as coreference and taxonomic. These arcs are also derived from other sources, including Rhetoric Structure theory, and respective indexing rules are introduced, which identify inter-sentence relations and joins phrases connected by these relations in the search index. Generalization of syntactic parse trees (as a similarity measure between sentences) is defined as a set of maximum common sub-trees for two parse trees. Generalization of a pair of parse thickets to measure relevance of a question and an answer, distributed in multiple sentences, is defined as a set of maximal common sub-parse thickets. The proposed approach is evaluated in the product search domain of eBay.com, where user query includes product names, features and expressions for user needs, and the query keywords occur in different sentences of text. We demonstrate that search relevance is improved by single sentence-level generalization, and further increased by parse thicket generalization. The proposed approach is evaluated in the product search domain of eBay.com, where user query includes product names, features and expressions for user needs, and the query keywords occur in different sentences of text.

Язык: английский

Ключевые слова: learning syntactic parse tree syntactic generalization search relevance learning taxonomy

ПУБЛИКАЦИЯ ПОДГОТОВЛЕНА ПО РЕЗУЛЬТАТАМ ПРОЕКТА:

Математические модели, алгоритмы и программные средства интеллектуального анализа больших данных (Big Data) в текстовой и структурной форме (2013)

В книге

Conceptual Structures for STEM Research and Education, 20th International Conference on Conceptual Structures

Vol. 7735: Conceptual Structures for STEM Research and Education, 20th International Conference on Conceptual Structures. , Berlin, Heidelberg: Springer, 2013.

Improving Text Retrieval Efficiency with Pattern Structures on Parse Thickets

Кузнецов С. О., Строк Ф. В., Ильвовский Д. А. и др., , in: Proceedings of the Workshop Formal Concept Analysis Meets Information RetrievalVol. 977.: M.: CEUR Workshop Proceedings, 2013. P. 6–21.

Добавлено: 18 ноября 2013 г.

Parse thicket representations of text paragraphs

Galitsky B., Ильвовский Д. А., Кузнецов С. О. и др., , in: Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной Международной конференции «Диалог» (Бекасово, 29 мая - 2 июня 2013 г.). В 2-х т.Т. 1: Основная программа конференции. Вып. 12 (19).: М.: РГГУ, 2013. P. 239–255.

Мы разрабатываем технику представления структуры предложений и абзацев текста в виде графов. Мы определяем чащу синтаксиче ского разбора как объединение синтаксических деревьев разбора предложений. Чаща включает дуги между вершинами синтаксических деревьев для таких отношений, как кореферентность и таксономия. Эти дуги также получаются из других источников, в том числе, тео рии Риторических Структур и Речевых Актов. В работе предлагается алгоритм вычисления чащ разбора. ...

Добавлено: 1 ноября 2013 г.