?
Network N-gram Model of the Text. Topic Tree of the Text – Minimal Tree Subgraph of the Semantic Network
P. 114–126.
Современные средства автоматического смыслового анализа текстов в основном делают акцент на тематическом анализе текстов, который основан, преимущественно, на использовании механизмов латентно-семантического анализа, вероятностного латентно-семантического анализа и скрытого распределения Дирихле. Тематический анализ, в свою очередь, базируется на монограммной модели текста, то есть на предположении, что порядок слов в тексте не играет роли в анализе текста (так называемый «мешок слов»). Использование сетевой n-граммной модели текста для тематического моделирования не только позволяет выявлять иерархическую тематическую структуру анализируемого текста, но и улучшает лингвистическую интерпретируемость результатов анализа.
В книге
Cambridge Scholars Publishing, 2020.