?
Русские официальные документы домена “Здравоохранение” и оценка их лексической сложности с использованием ключевых слов
Представленное исследование выполняется в русле изучения доступности для восприятия и понимания русских официальных документов из социальных доменов здравоохранения, культуры и образования. Материал — Корпус русских локальных документов и актов CorRIDA, подкорпус документов здравоохранения (617 107 токенов). Исследование направлено на выявление лексической специфики официальных документов домена с помощью метода извлечения ключевых словоформ, а также на оценку полученных ключевых словоформ с точки зрения их общеязыковой частотности. Анализируя ключевые словоформы в контексте общеязыковой частотности, мы исходили из идеи, что частотные единицы проще для восприятия и понимания носителями языка. Эта идея традиционно используется при оценке лексической сложности текстов.
Исследование выполнено при поддержке гранта РНФ № 19-18-00525 «Понятность официального русского языка: юридическая и лингвистическая проблематика».