• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Статья

Подчиняются ли составные конструкции закону Ципфа?

Кочеткова Н. А., Клышинский Э. С., Ермаков П. Д.

Словари составных конструкций играют существенную роль при анализе текстов на естественном языке. Автоматизированное составление таких словарей позволяет сократить время на их разработку и повысить охват обрабатываемых конструкций. Наше исследование показало, что n-граммы в тексте подчиняются распределению Ципфа, однако степенной показатель распределения варьируется в широких пределах. Именно это свойство и было использовано для извлечения составных
конструкций, которые, с одной стороны, позволяют получить стилистические маркеры текста, а с другой стороны, сочетания, отражающие особенности предметной области.