• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • A
  • A
  • A
  • A
  • A
Обычная версия сайта
  • RU
  • EN
  • Национальный исследовательский университет «Высшая школа экономики»
  • Публикации ВШЭ
  • Глава
  • Использование BERT для классификации коротких научных текстов на русском языке
  • RU
  • EN
Расширенный поиск
Высшая школа экономики
Национальный исследовательский университет
Приоритетные направления
  • бизнес-информатика
  • государственное и муниципальное управление
  • гуманитарные науки
  • инженерные науки
  • компьютерно-математическое
  • математика
  • менеджмент
  • право
  • социология
  • экономика
по году
  • 2027
  • 2026
  • 2025
  • 2024
  • 2023
  • 2022
  • 2021
  • 2020
  • 2019
  • 2018
  • 2017
  • 2016
  • 2015
  • 2014
  • 2013
  • 2012
  • 2011
  • 2010
  • 2009
  • 2008
  • 2007
  • 2006
  • 2005
  • 2004
  • 2003
  • 2002
  • 2001
  • 2000
  • 1999
  • 1998
  • 1997
  • 1996
  • 1995
  • 1994
  • 1993
  • 1992
  • 1991
  • 1990
  • 1989
  • 1988
  • 1987
  • 1986
  • 1985
  • 1984
  • 1983
  • 1982
  • 1981
  • 1980
  • 1979
  • 1978
  • 1977
  • 1976
  • 1975
  • 1974
  • 1973
  • 1972
  • 1971
  • 1970
  • 1969
  • 1968
  • 1967
  • 1966
  • 1965
  • 1964
  • 1963
  • 1958
  • еще
Тематика
Новости
18 мая 2026 г.
В Вышке прошла XXX юбилейная научно-техническая конференция имени Е.В. Арменского
Организатором научного события выступает Московский институт электроники и математики им. А.Н. Тихонова ВШЭ. В этом году главный инженерный студенческий форум проходил 30-й раз и собрал рекордное число участников. Студенты, аспиранты и молодые специалисты из 50 вузов и организаций России представили научно-исследовательские доклады в ИТ-области. Отдельная секция была посвящена научно-исследовательским работам школьников.
15 мая 2026 г.
В НИУ ВШЭ разрабатывают нейросеть для сферы науки и инноваций
Исследователи НИУ ВШЭ учат большие языковые модели понимать русскоязычную научную терминологию, увеличивая при этом их энергоэффективность. Адаптированная модель работает в 2,7 раза быстрее и требует на 73% меньше памяти, чем исходная открытая модель, что позволяет запускать ее на более доступном оборудовании. Программа прошла государственную регистрацию.
15 мая 2026 г.
Стартовал совместный спецпроект бренд-медиа Вышки IQ Media и iFORA ИСИЭЗ
В мае 2026 года стартовал научно-популярный проект «Искусственный интеллект: технологии, данные и будущее», который стал результатом работы двух команд — проекта iFORA Института статистических исследований и экономики знаний НИУ ВШЭ и редакции бренд-медиа IQMedia. Медийно-аналитический спецпроект посвящен современному развитию искусственного интеллекта и аналитике больших данных.

 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!

Публикации
  • Книги
  • Статьи
  • Главы в книгах
  • Препринты
  • Верификация публикаций
  • Расширенный поиск
  • Правила использования материалов
  • Наука в ВШЭ

?

Использование BERT для классификации коротких научных текстов на русском языке

С. 103–109.
Кусакин И. К., Цурупа А. М., Алмакаев А. В., Романов А. Ю.

В данной работе рассматриваются подходы к обучению классификаторов научных статей на основе BERT с целью реализации приложения для адаптации лучших моделей для последующего использования в инфраструктуре ВИНИТИ РАН. Для этого лингвистическая модель BERT была обучена на специализированном корпусе научных текстов для последующего использования в качестве встроенной части классификатора. В работе приведены результаты экспериментов по обучению моделей классификации научных статей по первому и второму уровням Российского государственного рубрикатора научно-технической информации (ГРНТИ).

Язык: русский
Полный текст
DOI
Текст на другом сайте
Ключевые слова: machine learningобработка естественного языкаклассификация текстовtext classificationBERTRuBERTRuBERT

В книге

НТИ-2022. Научная информация в современном мире: глобальные вызовы и национальные приоритеты : материалы 10-ой научной конференции с международным участием, посвященной 70-летию ВИНИТИ РАН, Москва, 25–26 октября 2022 года.
М.: ВИНИТИ РАН, 2022.
Похожие публикации
Сравнительный анализ методов аспектного анализа тональности текстов
Абрегова З. Х., Двойникова А. А., В кн.: Альманах научных работ молодых ученых Университета ИТМО.: Университет ИТМО, 2025. С. 487–493.
В статье рассматриваются различные методы аспектного анализа тональности текстовых данных, включая как традиционные методы, основанные на правилах, так и современные алгоритмы машинного и глубокого обучения. В работе представлен сравнительный анализ корпусов данных и методов аспектного анализа тональности текстов, который является важной задачей в области обработки естественного языка и анализа данных. ...
Добавлено: 25 апреля 2026 г.
Machine Learning Approach to Anticancer Activity Prediction of Transition-Metal Complexes Based on a Large-Scale Experimental Database
Krasnov L., Malikov D., Kiseleva M. и др., Journal of Medicinal Chemistry 2026 Vol. 69 No. 8 P. 8838–8851
Добавлено: 23 апреля 2026 г.
Особые экономические зоны Российской Федерации: моделирование решений потенциальных резидентов и процесса их генерации
Плесовских А. Е., Journal of Applied Economic Research 2023 Т. 22 № 2 С. 323–354
В современных исследованиях широко обсуждается роль особых экономических зон в стимулировании экономического роста и развития России, формировании необходимых инвестиционных потоков и повышении инновационного потенциала страны за счет расширения производства продукции в высокотехнологичных отраслях экономики с высокой добавленной стоимостью. Цель исследования – моделирование процесса генерации резидентов и детерминация количественных факторов, оказывающих статистически значимый эффект на среднегодовой ...
Добавлено: 13 апреля 2026 г.
Нейросетевые инструменты в арсенале вузовского преподавателя
Федоров А. О., Вакку Г. В., Лебедева С. Э., Галактика медиа: журнал медиа исследований 2026 Т. 8 № 2 С. 163–182
С увеличением объемов данных преподаватель вуза может потратить годы на обработку и  систематизацию информации. Персонализированная помощь, рекомендации по контенту, сбор данных для обзоров литературы и оформление библиографических ссылок укрепляют роль искусственного интеллекта как эффективного нейросетевого инструмента научной коммуникации. В данной статье рассматриваются практические примеры использования таких инструментов, как Elicit, SciSpace, Consensus, Undermind и Paperfinder, для упрощения ...
Добавлено: 7 апреля 2026 г.
Replacing Criterion of Creativity with Criterion of Investment for Results Created by Artificial Intelligence
Пакшин П. К., Legal Issues in the Digital Age 2026 Vol. 7 No. 1 P. 32–48
Искусственный интеллект выполняет значимую функцию в процессе автоматизации, минимизируя операционное участие человека в таких сферах, как медицина, искусство и юриспруденция. Несмотря на исторически тесную взаимосвязь искусства и технологий, именно генеративный искусственный интеллект расширил потенциал для творческой деятельности. Существенным катализатором этого процесса стало распространение предобученных систем искусственного интеллекта, интенсифицировавших развитие технологий в области обработки естественного языка ...
Добавлено: 31 марта 2026 г.
A Tool for Mass Generation of Random Step Environment Models with User-Defined Landscape Features
Gabdrahmanov R., Tsoy T., Martinez-Garcia E. и др., , in: Proceedings of the 21st International Conference on Informatics in Control, Automation and Robotics - (Volume 1) ICINCO 2024.: SciTePress, 2024. P. 511–518.
Добавлено: 17 марта 2026 г.
Real-Bogus Classification for ZTF Data Releases: Two Approaches
Semenikhin T., Корнилов М. В., Pruzhinskaya M. и др., , in: 26th International Conference, DAMDID/RCDL 2024, Nizhny Novgorod, Russia, October 23–25, 2024, Revised Selected Papers. Data Analytics and Management in Data Intensive Domains. (CCIS, volume 2641).: Springer, 2026. P. 211–219.
Добавлено: 11 марта 2026 г.
Дискриминативная лемматизация сокращений в эпоху LLM
Глазкова А. В., Смаль И. В., Ляшевская О. Н. и др., Доклады Российской академии наук. Математика, информатика, процессы управления (ранее - Доклады Академии Наук. Математика) 2025 Т. 527 С. 146–155
В работе представлено исследование эффективности дискриминативных методов лемматизации сокращений в русскоязычных текстах. В отличие от генеративных подходов, дискриминативные модели осуществляют выбор оптимальной леммы из фиксированного набора вариантов, что исключает риск генерации грамматически некорректных словоформ. Впервые для русского языка проводится комплексный анализ четырех контекстно-ориентированных подходов: (1) ранжирования на основе маскированного языкового моделирования, (2) бинарной классификации, (3) ...
Добавлено: 10 марта 2026 г.
Transformer-based approaches for lemmatizing abbreviations in Russian texts
Glazkova A., Ляшевская О. Н., Morozov D. и др., Journal of Mathematical Sciences 2025 Vol. 546 P. 32–47
Добавлено: 10 марта 2026 г.
Кластеризация паттернов потребления электроэнергии умного дома на основе ансамблевых методов машинного обучения
Мальцева С. В., Бериков В. Б., Кладов Д. Е. и др., В кн.: Информатика и прикладная математика: Материалы X Международной научно-практической конференции (08.10 - 11.10.2025 г.)Т. 1: Сборник материалов часть 1.: Алматы: Институт информационных и вычислительных технологий КН МНВО РК, 2025. С. 227–232.
В работе рассматривается задача кластеризации паттернов потребления для частного домохозяйства. Для кластеризации суточных профилей нагрузки разработан и применен ансамблевый алгоритм на основе метрики Вассерштейна. Предложенный подход позволяет выделить типичные сценарии энергопотребления, интерпретировать поведение потребителя. Приводятся результаты вычислительных экспериментов на реальных данных. ...
Добавлено: 3 марта 2026 г.
Development of a Language Model for Automated Classification of English-Language Scientific Articles by SRSTI Codes
V. V. Zunin, A. I. Afonin, V. I. Anoshin и др., Automatic Documentation and Mathematical Linguistics 2025 Vol. 59 No. 5 P. 287–293
Добавлено: 11 февраля 2026 г.
Method of Automated Dataset Collection for Microwave Filters Synthesis
Arinin O. V., Bakhmach D. M., Кацнельсон А. И. и др., , in: 2025 Systems of Signals Generating and Processing in the Field of on Board Communications.: IEEE, 2025. P. 1–5.
Добавлено: 6 декабря 2025 г.
Психолингвистический анализ непрофессионального дискурса о коррупции в социальной сети в «ВКонтакте»
Кузнецова Ю. М., Максименко А. А., Станкевич М. А. и др., Мониторинг общественного мнения: Экономические и социальные перемены 2026 № 1 С. 231–250
Статья посвящена анализу непрофессионального онлайн-дискурса о коррупции, представленного в социальной сети «ВКонтакте». В отличие от институционального или экспертного подхода, фокус на обыденной, пользовательской рефлексии позволяет уловить глубинные ценностные установки, формы выражения и языковые паттерны повседневной морали, что особенно актуально в условиях роста значимости социальных сетей как источника информации и формирования общественных настроений. Целью исследования являлось ...
Добавлено: 6 ноября 2025 г.
Анализ аффективной поляризации в российском онлайн-пространстве в условиях политической мобилизации: подход машинного обучения
Кручинская Е. В., Вестник Российского университета дружбы народов. Серия: Политология 2025 Т. 27 № 3 С. 459–478
В условиях глобального роста политической напряженности и повсеместного учащения протестных выступлений изучение динамики аффективной поляризации становится все более актуальным. Этот феномен, ранее доминировавший в политическом ландшафте США и изучавшийся сквозь призму партийной принадлежности, приобретает значение и в других странах. Распространение аффективной поляризации фиксируется и для России, имеющей богатую историю политических размежеваний. Несмотря на актуальность темы, ...
Добавлено: 19 октября 2025 г.
ОТСЛЕЖИВАНИЕ РАЗВИТИЯ РАЗРУШЕНИЯ С ПОМОЩЬЮ КЛАСТЕРИЗАЦИИ ИМПУЛЬСОВ ТЕРМИЧЕСКИ СТИМУЛИРОВАННОЙ АКУСТИЧЕСКОЙ ЭМИССИИ ПРИ ОТСУТСТВИИ ЛОКАЦИИ
Индаков Г. С., Казначеев П. А., Майбук З. Я. и др., Геофизические исследования 2025 Т. 26 № 2 С. 99–124
Исследована группируемость импульсов акустической эмиссии при высокотемпературном нагреве образца песчаника, предварительно подвергнутого механическому нагружению. Механическое нагружение осуществлялось в одноосном режиме до нагрузки, близкой к разрушающей, с проявлением на поверхности признаков крупных трещин. После этого образец нагревался до 650 °C с регистрацией импульсов термоакустической эмиссии (ТАЭ). Проведена кластеризация импульсов на основе их сходства, установленного методом взаимной ...
Добавлено: 19 сентября 2025 г.
Rewriting the Rules: LLMs Vs. Traditional ML in University Admissions
Чепиков И. А., Карпов И. А., , in: 26th International Conference, AIED 2025, Palermo, Italy, July 22–26, 2025, Proceedings, Part I. Artificial Intelligence in Education. Posters and Late Breaking Results, Workshops and Tutorials, Industry and Innovation Tracks, Practitioners, Doctoral Consortium, Blue Sky, and WideAIED.: Springer, 2025. P. 352 – 358.
Добавлено: 4 сентября 2025 г.
Proceedings of the 63rd Annual Meeting of the Association for Computational Linguistics
Wien: Association for Computational Linguistics, 2025.
Добавлено: 26 августа 2025 г.
Analysis of a Company Model in Conditions of Unstable Demand Using Reinforcement Learning Methods
Delev A., Semakov S., , in: 2025 8th International Conference on Artificial Intelligence and Big Data (ICAIBD).: IEEE, 2025. P. 318–322.
Добавлено: 25 августа 2025 г.
  • О ВЫШКЕ
  • Цифры и факты
  • Руководство и структура
  • Устойчивое развитие в НИУ ВШЭ
  • Преподаватели и сотрудники
  • Корпуса и общежития
  • Закупки
  • Обращения граждан в НИУ ВШЭ
  • Фонд целевого капитала
  • Противодействие коррупции
  • Сведения о доходах, расходах, об имуществе и обязательствах имущественного характера
  • Сведения об образовательной организации
  • Людям с ограниченными возможностями здоровья
  • Единая платежная страница
  • Работа в Вышке
  • ОБРАЗОВАНИЕ
  • Лицей
  • Довузовская подготовка
  • Олимпиады
  • Прием в бакалавриат
  • Вышка+
  • Прием в магистратуру
  • Аспирантура
  • Дополнительное образование
  • Центр развития карьеры
  • Бизнес-инкубатор ВШЭ
  • Образовательные партнерства
  • Обратная связь и взаимодействие с получателями услуг
  • НАУКА
  • Научные подразделения
  • Исследовательские проекты
  • Мониторинги
  • Диссертационные советы
  • Защиты диссертаций
  • Академическое развитие
  • Конкурсы и гранты
  • Внешние научно-информационные ресурсы
  • РЕСУРСЫ
  • Библиотека
  • Издательский дом ВШЭ
  • Книжный магазин «БукВышка»
  • Типография
  • Медиацентр
  • Журналы ВШЭ
  • Публикации
  • http://www.minobrnauki.gov.ru/
    Министерство науки и высшего образования РФ
  • https://edu.gov.ru/
    Министерство просвещения РФ
  • http://www.edu.ru
    Федеральный портал «Российское образование»
  • https://elearning.hse.ru/mooc
    Массовые открытые онлайн-курсы
  • НИУ ВШЭ1993–2026
  • Адреса и контакты
  • Условия использования материалов
  • Политика конфиденциальности
  • Правила применения рекомендательных технологий в НИУ ВШЭ
  • Карта сайта
Редактору