?
Оценка качества использования больших языковых моделей в задачах машинного перевода
Представлены результаты сравнительной оценки качества машинного перевода, выполненного большими языковыми моделями (LLM): DeepSeek, Grok, Mistral, Qwen, GigaChat, Yandex, на основе перевода выразительных языковых средств (фразеологизмов, омонимов, каламбуров и т.д.) и текстов различных функциональных стилей. Качество перевода оценивалось количественно с помощью метрик когерентности (BLEU, METEOR, chrF) и качественно — путем экспертного анализа на соответствие критериям адекватности, эквивалентности и гармонии с использованием эталонного перевода, а также сравнения с результатами системы Google Translate. Исследование показывает, что современные LLM способны преодолевать классические проблемы машинного перевода и представляют собой новую парадигму для создания гибридных систем «человек-ИИ».