?
К построению инвентаря русских именных конструкций
В докладе обсуждаются результаты экспериментов по автоматическому выделению конструкций, проводимых на материале Национального корпуса русского языка (НКРЯ). С этой целью разработан компьютерный инструмент, позволяющий извлекать и обрабатывать сочетаемостные данные из выборок НКРЯ. В качестве целевых слов выступают русские имена существительные. Для каждого из целевых слов получены списки конструкций – наиболее частотные сочетания, включающие целевое слово, частотные лексико-семантические теги – контекстные маркеры того или иного значения целевого слова, а также частотные леммы, характеризуемые этими семантическими тегами. Например: ВИД (разновидность, тип) + r:abstr t:sport: спорт, футбол, биатлон и т.д. Выделенные конструкции систематизируются по структуре и лексико-семантическому наполнению. В заключение проводится проверка результатов экспериментов, предполагающая сравнение списков конструкций со сведениями о коллокациях, устойчивых сочетаниях и т.д., зарегистрированных в различных лингвистических источниках (сервисы поиска биграмм, словари).