Using RuGPT3-XL Model for RuNormAS competition

Emelyanov A.; Shliazhko O.; Katricheva N.; T. Shavrina

Публикации

?

Using RuGPT3-XL Model for RuNormAS competition

Ch. 18. P. 204–212.

Emelyanov A., Shliazhko O., Katricheva N., Шаврина Т. О.

Научный редактор перевода: Селегей В.

В статье представлена методология дообучения языковой модели RuGPT3-XL (Generative Pretrained Transformer-3 для русского языка) для задачи нормализации спанов текста. Решение представлено на конкурсе по двум задачам: Нормализация именованных сущностей (Named entity) и Нормализация более широкого класса фрагментов текста, включая нормализацию различных частей речи (Generic spans). Лучшее решение достигло точности 0.9645 для задачи нормализации фрагментов текста и 0.9575 для именованных сущностей. Представляемые решения находятся в открытом доступе по адресу https://github.com/ RussianNLP/RuNormAS-solution

Язык: английский

Полный текст

Текст на другом сайте

Ключевые слова: генерация текста normalization generative modeling генеративные модели generative language models

В книге

Computational Linguistics and Intellectual Technologies: Papers from the Annual International Conference “Dialogue” (2021)

Issue 20: Основной том. , -, 2021.

Искусственный интеллект как институциональный вызов: диагностика дисфункций системы образования и науки и возможные регуляторные ответы

Капитонов И. А., Москвитин О. А., Современное профессиональное образование 2026 № 5 С. 55–57

В статье рассматривается проблема институциональной неготовности российской системы образования и науки к массовому распространению генеративного искусственного интеллекта. Авторы фиксируют парадоксальную асимметрию: студенты и аспиранты активно применяют ИИ для делегирования текстопроизводства, тогда как научно-педагогические работники в большинстве своём не используют его как исследовательский инструмент. Показано, что в основе этой асимметрии лежит не «злой умысел» участников, а ...

Добавлено: 23 июня 2026 г.

Transformer-based approaches for lemmatizing abbreviations in Russian texts

Glazkova A., Ляшевская О. Н., Morozov D. и др., Journal of Mathematical Sciences 2025 Vol. 546 P. 32–47

Добавлено: 10 марта 2026 г.

Диффузионные модели для генерации синтетических табличных данных

Телешева Э. Д., Гущин М. И., Доклады Российской академии наук. Математика, информатика, процессы управления (ранее - Доклады Академии Наук. Математика) 2025 Т. 527 № S С. 388–399

Задача генерации высококачественных синтетических данных имеет ключевое значение для многих задач, связанных с наукой о данных. Сгенерированный набор данных может сократить затраты на дополнение существующих данных дополнительными, например в физике, или помочь с защитой конфиденциальности, например в банковской сфере. Однако генерация табличных данных является сложной задачей, поскольку данные содержат как числовые, так и категориальные признаки. ...

Добавлено: 12 февраля 2026 г.

Искусственный интеллект как симулякр смысла

Малинов С. А., Галактика медиа: журнал медиа исследований 2025 Т. 7 № 4 С. 154–173

В последние годы искусственный интеллект (ИИ) активно внедряется в повседневную жизнь человека. Его популярность неуклонно растёт, а компании всё чаще используют ИИ для оптимизации и ускорения рабочих процессов. Повседневные пользователи применяют большие языковые модели (Large Language Models, LLM) и мультимодальные ИИ-системы для решения широкого круга задач: генерации текстов, изображений и видео, планирования дня, поиска информации ...

Добавлено: 7 декабря 2025 г.

Дискурсивные возможности больших языковых моделей при решении задач генерации новых текстов

Мыльникова А. В., Гасимов А. Р., Научно-техническая информация. Серия 2: Информационные процессы и системы 2025 № 9 С. 33–38

На основе изучения функционирования больших языковых моделей (LLMs) и специфических характеристик машинной обработки дискурса показано применение экспериментального метода компьютерного и лингвистического анализа для статистического исследования и интерпретации лингвистических характеристик текстов. В качестве материалов исследования использован лингвистический корпус текстов Brown, а также корпуса искусственно сгенерированных текстов с применением Claude Sonnet 3.7 и Grok-3. В механизмах обработки ...

Добавлено: 19 ноября 2025 г.

Новые интерфейсы и новые медиаторы

Максименкова О. В., Сегал А. П., Вопросы философии 2025 № 10 С. 67–76

Исследование посвящено проблеме взаимодействия человека и искус ственного интеллекта (ИИ). Авторы рассматривают это взаимодействие как опосредованное интерфейсами, которые одновременно и упрощают его, и скрывают реальные механизмы кодирования и декодирования сооб щений (по К. Шеннону). В такой ситуации характеристики субъекта (акто ра) коммуникации размываются, и в качестве такового предстает не сам актор, но его инструмент, а ...

Добавлено: 2 октября 2025 г.

Generative models and seq2seq techniques for the flash-simulation of the LHCb experiment

Деркач Д. А., Anderlini L., Capelli S. и др., Proceedings of Science 2025 Vol. 476 P. 1032

Добавлено: 13 марта 2025 г.

The LHCb ultra-fast simulation option, Lamarr design and validation

Деркач Д. А., Казеев Н. А., Мохненко С. Н. и др., EPJ Web of Conferences 2024 Vol. 295 P. 03040

Добавлено: 8 января 2025 г.

Катехон в эпоху ярости кибернетических систем

Хестанов Р. З., Логос 2024 Т. 34 № 6 С. 275–296

В статье утверждается, что одной из основных характеристик модерна является лежащий в его основании парадокс, который можно было бы обозначить как установку на секьюритизацию через катастрофу. Автор показывает, каким образом из стремления к преодолению катастроф и кризисов формируется установка на их утилизацию, то есть на создание аппаратов или устройств, гарантирующих безопасность и успешное преобразование катастроф ...

Добавлено: 1 января 2025 г.

ЛИНГВОДИДАКТИЧЕСКИЙ АСПЕКТ ЦИФРОВОЙ КОМПЕТЕНЦИИ ПРЕПОДАВАТЕЛЯ ИНОСТРАННЫХ ЯЗЫКОВ: ТРАНСФОРМАЦИИ И АКТУАЛЬНОСТЬ

Соломонова А. А., Садекова С. Р., Русский язык за рубежом 2024 № 3 (304) С. 95–99

Данная статья рассматривает важность цифровой компетенции преподавателей иностранных языков в современном образовании. Анализирует преимущества использования цифровых технологий в образовательном процессе и необходимость освоения преподавателями инструментов цифровой обработки информации. Особое внимание уделено лингводидактическому аспекту цифровой компетенции, включая разработку персонализированных образовательных материалов, автоматизированную оценку и обратную связь, а также использование генеративных моделей в образовании. Также обсуждается этичность ...

Добавлено: 29 октября 2024 г.

Исследование потенциала генеративных моделей для оценивания эссе и обеспечения обратной связи

Боголепова С. В., Жаркова М. Г., Отечественная и зарубежная педагогика 2024 Т. 1 № 5(101) С. 123–137

В эпоху интенсивного развития генеративных языковых моделей эти инструменты все больше используются преподавателями и студентами. Данная работа посвящена исследованию потенциала использования генеративных моделей, взаимодействующих с пользователем посредством чат-ботов ChatGPT и PerplexityAI, для оценки студенческих эссе, написанных в формате стандартизированного экзамена по английскому языку, и формулировки обратной связи по качеству студенческих работ. С учетом специфики каждого ...

Добавлено: 28 октября 2024 г.

Improving GFlowNets with Monte Carlo Tree Search

Морозов Н. В., Тяпкин Д. Н., Самсонов С. В. и др., , in: ICML 2024 Workshop on Structured Probabilistic Inference & Generative Modeling.: OpenReview, 2024.

Добавлено: 24 октября 2024 г.

ICML 2024 Workshop on Structured Probabilistic Inference & Generative Modeling

OpenReview, 2024.

Добавлено: 24 октября 2024 г.

Soft Margin Spectral Normalization for GANs

Рогачев А. И., Ратников Ф. Д., Computing and Software for Big Science 2024 Vol. 8 No. 1 Article 12

In this paper, we explore the use of Generative Adversarial Networks (GANs) to speed up the simulation process while ensuring that the generated results are consistent in terms of physics metrics. Our main focus is the application of spectral normalization for GANs to generate electromagnetic calorimeter (ECAL) response data, which is a crucial component of ...

Добавлено: 2 июля 2024 г.