?
Аннотированные суффиксные деревья: особенности реализации
В статье описываются особенности эффективной программной реализации разработанной с участием одного из ав- торов модификации суффиксных деревьев, предполагающей ан- нотацию узлов дерева частотами встречаемости соответствую- щих им подстрок в исходной коллекции текстов. Данная структу- ра данных имеет ряд практически важных приложений, таких как оценка степени вхождения последовательности символов в текст или анализ связей между ключевыми словосочетаниями. Пред- ложенные в данной работе модификации известных алгоритмов быстрого построения обычных суффиксных деревьев, а также описываемые в ней приемы хранения аннотированных суффикс- ных деревьев в памяти делают возможным их практическое при- менение для анализа больших коллекций текстов, что подтвер- ждается приводимыми в тексте статьи результатами сравнитель- ного исследования производительности различных реализаций метода АСД на реальных данных.