?
ПРИМЕНЕНИЕ СТИЛОМЕТРИИ ДЛЯ ОПРЕДЕЛЕНИЯ СГЕНЕРИРОВАННЫХ ТЕКСТОВ
С. 176–182.
Е. А. Сальников, А. А. Бонч-Осмоловская
В рамках данного доклад будет проанализировано использование стилометрической метрики дельта Бёрроуза в качестве метода для определения искусственного (т. е. сгенерированного языковой моделью) текста. Данными для эксперимента послужили дневники – как дневниковые записи случайно выбранных авторов, так и дневниковые записи М. М. Пришвина. В качестве данных языковых моделей послужили дневниковые записи, сгенерированные при помощи языковых моделей ChatGPT и Vicuna_12b. Путём кластеризации подкорпусов на основе дельты Бёрроуза была установлено, что стилометрический подход позволяет достаточно уверенно отличать тексты, написанные людьми, от текстов, сгенерированных языковыми моделями.
Язык:
русский
В книге
Сибирский федеральный университет, 2023.