• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Глава

Using RuGPT3-XL Model for RuNormAS competition

P. 204-212.
Emelyanov A., Shliazhko O., Katricheva N., Shavrina T.
Научный редактор перевода: В. Селегей.

В статье представлена методология дообучения языковой модели RuGPT3-XL (Generative Pretrained Transformer-3 для русского языка) для задачи нормализации спанов текста. Решение представлено на конкурсе по двум задачам: Нормализация именованных сущностей (Named entity) и Нормализация более широкого класса фрагментов текста, включая нормализацию различных частей речи (Generic spans). Лучшее решение достигло точности 0.9645 для задачи нормализации фрагментов текста и 0.9575 для именованных сущностей. Представляемые решения находятся в открытом доступе по адресу https://github.com/ RussianNLP/RuNormAS-solution