?
Порядок следования прилагательных разных семантических классов в русском языке в свете корпусных данных
Работа посвящена исследованию порядка следования прилагательных в русском языке. Исследование проводилось на материале Национального корпуса русского языка. За основу взята иерархия порядка прилагательных, предложенная в работе Чинкве [Cinque 1994]: ‘посессивные’ > ’количественные’ > ’порядковые’ > ’оценка’ > ’размер’ > ’форма’ > ’цвет’ > ’национальность’. В ходе исследования был разработан метод построения иерархии, описывающей допустимые порядки, который основывается на попарном сравнении семантических классов прилагательных по доминирующей частоте следования прилагательных в соответствующей паре. В итоге, исследование выявило тенденцию к тому, что линеаризация прилагательных в реальных текстах соответствует иерархии за исключением класса посессивных прилагательных. Этот класс прилагательных делится на два: ‘конкретно-референтные’ (на -ин, -ов: папин, дедов) и ‘генерические’ (на -ий, -ский: лисий). ‘Генерические’ располагаются ближе к существительному и ведут себя как относительные прилагательные. Конкретно-референтные прилагательные занимают не крайнюю левую позицию, как в иерархии Чинкве, а располагаются ближе к относительным прилагательным – между классом ‘цвет’ и классом ‘национальность’. Такой результат служит подтверждением теоретических выводов относительно безартиклевых языков: в них прилагательные, соответствующие классу определителей (артиклей, посессивных конструкций и т.п.), приобретают детерминативную функцию в крайне-левой позиции в именной группе, в других позициях они ведут себя как относительные прилагательные. Анализ примеров, нарушающих ожидаемый порядок, показал, что такие нарушения могут быть связаны с семантическим сдвигом (коэрсией) в значении прилагательного, а также с образованием устойчивых словосочетаний. Контексты с нарушением порядка следования прилагательных могут быть использованы при оптимизации процедуры полуавтоматического снятия семантической неоднозначности, а в некоторых случаях могут служить одним из признаков, помогающих детектировать ошибки в семантической разметке.