• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Статья

Определение значимости лексики на основе статистического контент-анализа

В статье приведен алгоритм контент-анализа корпоративных документов с целью выявления уровня экспертизы сотрудников в той или иной предметной области. В процессе контент-анализа были выявлены наиболее значимые слова, описывающие смысл документов, сгенерированных сотрудником за определенный период времени, а также был предложен способ отсеивания общеупотребительной лексики.