Использование BERT для классификации коротких научных текстов на русском языке

?

Использование BERT для классификации коротких научных текстов на русском языке

С. 103–109.

Кусакин И. К., Цурупа А. М., Алмакаев А. В., Романов А. Ю.

В данной работе рассматриваются подходы к обучению классификаторов научных статей на основе BERT с целью реализации приложения для адаптации лучших моделей для последующего использования в инфраструктуре ВИНИТИ РАН. Для этого лингвистическая модель BERT была обучена на специализированном корпусе научных текстов для последующего использования в качестве встроенной части классификатора. В работе приведены результаты экспериментов по обучению моделей классификации научных статей по первому и второму уровням Российского государственного рубрикатора научно-технической информации (ГРНТИ).

Язык: русский

Полный текст

DOI

Текст на другом сайте

В книге

НТИ-2022. Научная информация в современном мире: глобальные вызовы и национальные приоритеты : материалы 10-ой научной конференции с международным участием, посвященной 70-летию ВИНИТИ РАН, Москва, 25–26 октября 2022 года.

М.: ВИНИТИ РАН, 2022.

The Use of the Missing Sample Simulation Modeling to Create a Classification Model for Three or More Classes by the Example of the Carbohydrate Metabolism Disorder Degree Detection Problem

Новиков Р. С., Novopashin M., Позин Б. А., Programming and Computer Software 2026 Vol. 52 No. 1 P. 28 – 38

Добавлено: 26 июня 2026 г.

Сравнительный анализ методов аспектного анализа тональности текстов

Абрегова З. Х., Двойникова А. А., В кн.: Альманах научных работ молодых ученых Университета ИТМО.: Университет ИТМО, 2025. С. 487–493.

В статье рассматриваются различные методы аспектного анализа тональности текстовых данных, включая как традиционные методы, основанные на правилах, так и современные алгоритмы машинного и глубокого обучения. В работе представлен сравнительный анализ корпусов данных и методов аспектного анализа тональности текстов, который является важной задачей в области обработки естественного языка и анализа данных. ...

Добавлено: 25 апреля 2026 г.

Machine Learning Approach to Anticancer Activity Prediction of Transition-Metal Complexes Based on a Large-Scale Experimental Database

Krasnov L., Malikov D., Kiseleva M. и др., Journal of Medicinal Chemistry 2026 Vol. 69 No. 8 P. 8838–8851

Добавлено: 23 апреля 2026 г.

Особые экономические зоны Российской Федерации: моделирование решений потенциальных резидентов и процесса их генерации

Плесовских А. Е., Journal of Applied Economic Research 2023 Т. 22 № 2 С. 323–354

В современных исследованиях широко обсуждается роль особых экономических зон в стимулировании экономического роста и развития России, формировании необходимых инвестиционных потоков и повышении инновационного потенциала страны за счет расширения производства продукции в высокотехнологичных отраслях экономики с высокой добавленной стоимостью. Цель исследования – моделирование процесса генерации резидентов и детерминация количественных факторов, оказывающих статистически значимый эффект на среднегодовой ...

Добавлено: 13 апреля 2026 г.

Нейросетевые инструменты в арсенале вузовского преподавателя

Федоров А. О., Вакку Г. В., Лебедева С. Э., Галактика медиа: журнал медиа исследований 2026 Т. 8 № 2 С. 163–182

С увеличением объемов данных преподаватель вуза может потратить годы на обработку и систематизацию информации. Персонализированная помощь, рекомендации по контенту, сбор данных для обзоров литературы и оформление библиографических ссылок укрепляют роль искусственного интеллекта как эффективного нейросетевого инструмента научной коммуникации. В данной статье рассматриваются практические примеры использования таких инструментов, как Elicit, SciSpace, Consensus, Undermind и Paperfinder, для упрощения ...

Добавлено: 7 апреля 2026 г.

Replacing Criterion of Creativity with Criterion of Investment for Results Created by Artificial Intelligence

Пакшин П. К., Legal Issues in the Digital Age 2026 Vol. 7 No. 1 P. 32–48

Искусственный интеллект выполняет значимую функцию в процессе автоматизации, минимизируя операционное участие человека в таких сферах, как медицина, искусство и юриспруденция. Несмотря на исторически тесную взаимосвязь искусства и технологий, именно генеративный искусственный интеллект расширил потенциал для творческой деятельности. Существенным катализатором этого процесса стало распространение предобученных систем искусственного интеллекта, интенсифицировавших развитие технологий в области обработки естественного языка ...

Добавлено: 31 марта 2026 г.

A Tool for Mass Generation of Random Step Environment Models with User-Defined Landscape Features

Gabdrahmanov R., Tsoy T., Martinez-Garcia E. и др., , in: Proceedings of the 21st International Conference on Informatics in Control, Automation and Robotics - (Volume 1) ICINCO 2024.: SciTePress, 2024. P. 511–518.

Добавлено: 17 марта 2026 г.

Real-Bogus Classification for ZTF Data Releases: Two Approaches

Semenikhin T., Корнилов М. В., Pruzhinskaya M. и др., , in: 26th International Conference, DAMDID/RCDL 2024, Nizhny Novgorod, Russia, October 23–25, 2024, Revised Selected Papers. Data Analytics and Management in Data Intensive Domains. (CCIS, volume 2641).: Springer, 2026. P. 211–219.

Добавлено: 11 марта 2026 г.

Дискриминативная лемматизация сокращений в эпоху LLM

Глазкова А. В., Смаль И. В., Ляшевская О. Н. и др., Доклады Российской академии наук. Математика, информатика, процессы управления (ранее - Доклады Академии Наук. Математика) 2025 Т. 527 С. 146–155

В работе представлено исследование эффективности дискриминативных методов лемматизации сокращений в русскоязычных текстах. В отличие от генеративных подходов, дискриминативные модели осуществляют выбор оптимальной леммы из фиксированного набора вариантов, что исключает риск генерации грамматически некорректных словоформ. Впервые для русского языка проводится комплексный анализ четырех контекстно-ориентированных подходов: (1) ранжирования на основе маскированного языкового моделирования, (2) бинарной классификации, (3) ...

Добавлено: 10 марта 2026 г.

Transformer-based approaches for lemmatizing abbreviations in Russian texts

Glazkova A., Ляшевская О. Н., Morozov D. и др., Journal of Mathematical Sciences 2025 Vol. 546 P. 32–47

Добавлено: 10 марта 2026 г.

Кластеризация паттернов потребления электроэнергии умного дома на основе ансамблевых методов машинного обучения

Мальцева С. В., Бериков В. Б., Кладов Д. Е. и др., В кн.: Информатика и прикладная математика: Материалы X Международной научно-практической конференции (08.10 - 11.10.2025 г.)Т. 1: Сборник материалов часть 1.: Алматы: Институт информационных и вычислительных технологий КН МНВО РК, 2025. С. 227–232.

В работе рассматривается задача кластеризации паттернов потребления для частного домохозяйства. Для кластеризации суточных профилей нагрузки разработан и применен ансамблевый алгоритм на основе метрики Вассерштейна. Предложенный подход позволяет выделить типичные сценарии энергопотребления, интерпретировать поведение потребителя. Приводятся результаты вычислительных экспериментов на реальных данных. ...

Добавлено: 3 марта 2026 г.

Development of a Language Model for Automated Classification of English-Language Scientific Articles by SRSTI Codes

V. V. Zunin, A. I. Afonin, V. I. Anoshin и др., Automatic Documentation and Mathematical Linguistics 2025 Vol. 59 No. 5 P. 287–293

Добавлено: 11 февраля 2026 г.

Method of Automated Dataset Collection for Microwave Filters Synthesis

Arinin O. V., Bakhmach D. M., Кацнельсон А. И. и др., , in: 2025 Systems of Signals Generating and Processing in the Field of on Board Communications.: IEEE, 2025. P. 1–5.

Добавлено: 6 декабря 2025 г.

Психолингвистический анализ непрофессионального дискурса о коррупции в социальной сети в «ВКонтакте»

Кузнецова Ю. М., Максименко А. А., Станкевич М. А. и др., Мониторинг общественного мнения: Экономические и социальные перемены 2026 № 1 С. 231–250

Статья посвящена анализу непрофессионального онлайн-дискурса о коррупции, представленного в социальной сети «ВКонтакте». В отличие от институционального или экспертного подхода, фокус на обыденной, пользовательской рефлексии позволяет уловить глубинные ценностные установки, формы выражения и языковые паттерны повседневной морали, что особенно актуально в условиях роста значимости социальных сетей как источника информации и формирования общественных настроений. Целью исследования являлось ...

Добавлено: 6 ноября 2025 г.

Анализ аффективной поляризации в российском онлайн-пространстве в условиях политической мобилизации: подход машинного обучения

Кручинская Е. В., Вестник Российского университета дружбы народов. Серия: Политология 2025 Т. 27 № 3 С. 459–478

В условиях глобального роста политической напряженности и повсеместного учащения протестных выступлений изучение динамики аффективной поляризации становится все более актуальным. Этот феномен, ранее доминировавший в политическом ландшафте США и изучавшийся сквозь призму партийной принадлежности, приобретает значение и в других странах. Распространение аффективной поляризации фиксируется и для России, имеющей богатую историю политических размежеваний. Несмотря на актуальность темы, ...

Добавлено: 19 октября 2025 г.

ОТСЛЕЖИВАНИЕ РАЗВИТИЯ РАЗРУШЕНИЯ С ПОМОЩЬЮ КЛАСТЕРИЗАЦИИ ИМПУЛЬСОВ ТЕРМИЧЕСКИ СТИМУЛИРОВАННОЙ АКУСТИЧЕСКОЙ ЭМИССИИ ПРИ ОТСУТСТВИИ ЛОКАЦИИ

Индаков Г. С., Казначеев П. А., Майбук З. Я. и др., Геофизические исследования 2025 Т. 26 № 2 С. 99–124

Исследована группируемость импульсов акустической эмиссии при высокотемпературном нагреве образца песчаника, предварительно подвергнутого механическому нагружению. Механическое нагружение осуществлялось в одноосном режиме до нагрузки, близкой к разрушающей, с проявлением на поверхности признаков крупных трещин. После этого образец нагревался до 650 °C с регистрацией импульсов термоакустической эмиссии (ТАЭ). Проведена кластеризация импульсов на основе их сходства, установленного методом взаимной ...

Добавлено: 19 сентября 2025 г.

Rewriting the Rules: LLMs Vs. Traditional ML in University Admissions

Чепиков И. А., Карпов И. А., , in: 26th International Conference, AIED 2025, Palermo, Italy, July 22–26, 2025, Proceedings, Part I. Artificial Intelligence in Education. Posters and Late Breaking Results, Workshops and Tutorials, Industry and Innovation Tracks, Practitioners, Doctoral Consortium, Blue Sky, and WideAIED.: Springer, 2025. P. 352 – 358.

Добавлено: 4 сентября 2025 г.