?
Развитие модели, основанной на знании об авторах, для поисковых применений
Предлагается новая технология для широких поисковых применений к текстам естественного языка. Данная технология принимает во внимание информацию об авторстве документов и основана на анализе сети коммуникаций между авторами. Подробно рассматривается ее частное применение для задачи поиска экспертов. В качестве коллекций данных для проведения экспериментов используются корпуса TREC Enterprise track. Точность поиска экспертов, даваемая реализованной моделью, сравнима с наиболее эффективными современными информационно-поисковыми системами и движками. Обсуждается возможность применения описанного движка к другим поисково-аналитическим сценариям, таким как поиск плагиата, поиск информационных разрывов и др.