• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Глава

Сети как инструмент поиска и находок в мультиязычных параллельных корпусах

Цель этой статьи — представить новую методологию анализа семантических полей в области лексической типологии. Исследование лексических систем разных языков предполагает использование определенного набора лингвистических методов сбора и анализа данных. Источником данных на разных этапах служат словари, языковые корпуса, в том числе и  параллельные, и, конечно, данные, полученные с помощью анкетирования носителей языка. Собранные из разных языков лексические контексты на следующем этапе требуют обобщения на более абстрактном уровне, для этого используется метод семантического картирования, позволяющий «наглядно представить структуру пространства — в данном случае, пространства определенного семантического поля — и конкретные варианты его организации». Современный подход к визуализации данных предполагает, что наглядное изображение ценно не только само по себе, но еще и как отображение стоящей за ним математической модели: дискретных соотнесенных параметров и измерителей, которые могут становиться объектами оценки и вычислений. В этом случае открывается множество возможностей применения к исходно неструктурированным языковым данным математических техник и статистистических метрик для получения объективных и надежных оценок и предсказаний и, что особенно важно, новых инсайтов о внутренней структуре модели. Важный шаг в этом направлении был сделан в работе Д. Рыжовой и С. Объедкова, где в качестве альтернативы семантическим картам был предложен метод формальных концептуальных решеток, строгий математический формализм, позволяющий предсказывать возможности и ограничения распределения значений между лексическими единицами.