• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • A
  • A
  • A
  • A
  • A
Обычная версия сайта
  • RU
  • EN
  • Национальный исследовательский университет «Высшая школа экономики»
  • Публикации ВШЭ
  • Глава
  • Применение меры tf-idf и меры странности для выделения ключевых слов при классификации текстов научных статей
  • RU
  • EN
Расширенный поиск
Высшая школа экономики
Национальный исследовательский университет
Приоритетные направления
  • бизнес-информатика
  • государственное и муниципальное управление
  • гуманитарные науки
  • инженерные науки
  • компьютерно-математическое
  • математика
  • менеджмент
  • право
  • социология
  • экономика
по году
  • 2027
  • 2026
  • 2025
  • 2024
  • 2023
  • 2022
  • 2021
  • 2020
  • 2019
  • 2018
  • 2017
  • 2016
  • 2015
  • 2014
  • 2013
  • 2012
  • 2011
  • 2010
  • 2009
  • 2008
  • 2007
  • 2006
  • 2005
  • 2004
  • 2003
  • 2002
  • 2001
  • 2000
  • 1999
  • 1998
  • 1997
  • 1996
  • 1995
  • 1994
  • 1993
  • 1992
  • 1991
  • 1990
  • 1989
  • 1988
  • 1987
  • 1986
  • 1985
  • 1984
  • 1983
  • 1982
  • 1981
  • 1980
  • 1979
  • 1978
  • 1977
  • 1976
  • 1975
  • 1974
  • 1973
  • 1972
  • 1971
  • 1970
  • 1969
  • 1968
  • 1967
  • 1966
  • 1965
  • 1964
  • 1963
  • 1958
  • еще
Тематика
Новости
17 июня 2026 г.
Биоинформатики НИУ ВШЭ обнаружили 20 опасных мутаций в гене, связанном с легочной артериальной гипертензией
Ученые НИУ ВШЭ совместно с коллегами из российских университетов выяснили, какие мутации в гене ACVRL1 опасны для пациентов с легочной артериальной гипертензией. Они смоделировали, как изменения в гене влияют на связывание АТФ с белком — процесс, от которого зависит передача сигналов, необходимых для работы сосудов. Оказалось, что 20 из 32 вариантов могут нарушать передачу сигнала и провоцировать болезнь. Результаты опубликованы в Journal of Structural Biology.
17 июня 2026 г.
Интеллектуальная робототехника: кадровый голод и масса возможностей
Пока на рынке мало кадров, способных заниматься разработкой интеллектуальных робототехнических систем. Между тем именно к этому идет робототехника. Как учат ее проектированию и каково будущее отрасли, в интервью IQ Media рассказал заведующий Проектно-учебной лабораторией робототехники НИУ ВШЭ Вадим Моргачев.
17 июня 2026 г.
Каким должно быть образование, чтобы готовить кадры для экономики будущего
Эти вопросы обсудят на форуме HR EXPO PRO ЛЮДЕЙ, который состоится 18-19 июня в Москве. В его работе примет участие ректор НИУ ВШЭ Никита Анисимов, федеральные министры, HR-директора компаний, ректоры вузов, эксперты. На форуме будет представлен стенд, посвященный программам ДПО НИУ ВШЭ.

 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!

Публикации
  • Книги
  • Статьи
  • Главы в книгах
  • Препринты
  • Верификация публикаций
  • Расширенный поиск
  • Правила использования материалов
  • Наука в ВШЭ

?

Применение меры tf-idf и меры странности для выделения ключевых слов при классификации текстов научных статей

С. 42–42.
Козлова Е. С., Романов А. Ю.

В рамках исследования используются две меры для выделения ключевых слов в наборе текстов: tf-idf и weirdness (мера странности). В исследовании используется выборка из более чем двадцати двух тысяч научных статей из девяти тем УДК. Задача исследования состояла в выделении оптимального набора слов для быстрой классификации заданного текста.

Язык: русский
Полный текст
Текст на другом сайте
Ключевые слова: УДКUDCTF-IDFTF-IDF

В книге

Информатика, математика, автоматика: 2016. Материалы научно-технической конференции
Сумы: СумДу, 2016.
Похожие публикации
Aschern at CheckThat! 2021: Lambda-Calculus of Fact-Checked Claims
Чернявский А. С., Ильвовский Д. А., Nakov P., , in: CLEF 2021 Working Notes.: CEUR Workshop Proceedings, 2021. P. 484–493.
Добавлено: 9 мая 2024 г.
Native Language Identification for Russian
Ремнев Н. В., , in: 2019 International Conference on Data Mining Workshops (ICDMW).: IEEE, 2019. P. 1–7.
Добавлено: 18 октября 2021 г.
Native Language Identification For Russian Using Errors Types
Ремнев Н. В., , in: Компьютерная лингвистика и интеллектуальные технологии: по материалам ежегодной международной конференции «Диалог» (Москва, 17–20 июня 2020 г.)Issue 19(26): дополнительный том.: -, 2020. P. 1123–1133.
Добавлено: 18 октября 2021 г.
Automatization of Scientific Articles Classification According to Universal Decimal Classifier
Романов А. Ю., Lomotin K.E., Kozlova E.S., , in: Supplementary Proceedings of the Sixth International Conference on Analysis of Images, Social Networks and Texts (AIST-SUP 2017), Moscow, Russia, July 27-29, 2017Vol. 1975.: Aachen: CEUR-WS.org, 2017. P. 122–133.
Добавлено: 28 ноября 2017 г.
Comparative analysis of classification methods for text in UDC code generation problem for scientific articles
Lomotin K. E., Kozlova E. S., Романов А. Ю., , in: Information Innovative Technologies: Materials of the International scientific–рractical conference.: M.: Association of graduates and employees of AFEA named after prof. Zhukovsky, 2017. P. 359–363.
Добавлено: 30 июля 2017 г.
Применение методов машинного обучения для решения задачи автоматической рубрикации статей по УДК
Романов А. Ю., Ломотин К. Е., Козлова Е. С., Информационные технологии 2017 Т. 23 № 6 С. 418–423
Работа посвящена исследованию применимости современных методов машинного обучения к задаче автоматической генерации кодов УДК научных статей. В качестве классификаторов рассматриваются такие модели, как искусственные нейронные сети, логистическая регрессия и бустинг. Разработаны графовые алгоритмы и прототип программного модуля для генерации кода УДК. ...
Добавлено: 30 июля 2017 г.
Применение современных методов классификации к рубрикации научных статей по УДК
Ломотин К. Е., Козлова Е. С., Колесниченко А. Л. и др., В кн.: Инновационные, информационные и коммуникационные технологии: сборник трудов XIII Международной научно-практической конференции.: М.: Ассоциация выпускников и сотрудников ВВИА им. проф. Жуковского, 2016. С. 92–95.
В статье анализируется эффективность применения современных средств классификации к задаче рубрикации текстов научных статей в соответствии с УДК. Исследуются следующие средства классификации: искусственные нейронные сети, наивный байесовский классификатор, деревья принятия решений и случайный лес. ...
Добавлено: 29 октября 2016 г.
Применение искусственной нейронной сети для рубрикации научных статей по УДК
Ломотин К. Е., Романов А. Ю., В кн.: Информатика, математика, автоматика: 2016. Материалы научно-технической конференции.: Сумы: СумДу, 2016. С. 43–43.
Использование искусственных нейронных сетей (ИНС) для решения задач классификации позволяет разделить такие сложные классы образов, какими являются темы классификатора УДК. Для проведения исследования нами выбран классификатор гиперплоскостной группы, реализованный в виде многослойного персептрона Розенблатта. ...
Добавлено: 11 июня 2016 г.
Research of Neural Networks Application Efficiency in Automatic Scientific Articles Classification According to UDC
Романов А. Ю., Lomotin K.E., Kozlova E.S. и др., , in: 2016 International Siberian Conference on Control and Communications (SIBCON). Proceedings.: M.: HSE, 2016. Ch. 543fu4t.
В данной работе рассмотрена реализация автоматической рубрикации текстов научных статей по классификатору UDC, проведено исследование эффективности применения  нейросетевых технологий для данной задачи. Предложены оптимальная архитектура и параметры нейронной сети. ...
Добавлено: 11 июня 2016 г.
Разработка рубрикатора информационно-образовательных ресурсов на основе УДК
Старых В. А., Белоозеров В. Н., Scientific and Technical Information Processing 2010 № 9 С. 25–34
Описан порядок работ и результаты разработки тематического рубрикатора информационно-образовательных ресурсов. В основу положена Универсальная десятичная классификация, имеющая международный статус и обязательная для  описания тематики научно-технической информации. На первом этапе заканчивается составление рубрикатора для тематики предметов общего среднего образования на основе требований государственных образовательных стандартов. ...
Добавлено: 14 октября 2013 г.
  • О ВЫШКЕ
  • Цифры и факты
  • Руководство и структура
  • Устойчивое развитие в НИУ ВШЭ
  • Преподаватели и сотрудники
  • Корпуса и общежития
  • Закупки
  • Обращения граждан в НИУ ВШЭ
  • Фонд целевого капитала
  • Противодействие коррупции
  • Сведения о доходах, расходах, об имуществе и обязательствах имущественного характера
  • Сведения об образовательной организации
  • Людям с ограниченными возможностями здоровья
  • Единая платежная страница
  • Работа в Вышке
  • ОБРАЗОВАНИЕ
  • Лицей
  • Довузовская подготовка
  • Олимпиады
  • Прием в бакалавриат
  • Вышка+
  • Прием в магистратуру
  • Аспирантура
  • Дополнительное образование
  • Центр развития карьеры
  • Бизнес-инкубатор ВШЭ
  • Образовательные партнерства
  • Обратная связь и взаимодействие с получателями услуг
  • НАУКА
  • Научные подразделения
  • Исследовательские проекты
  • Мониторинги
  • Диссертационные советы
  • Защиты диссертаций
  • Академическое развитие
  • Конкурсы и гранты
  • Внешние научно-информационные ресурсы
  • РЕСУРСЫ
  • Библиотека
  • Издательский дом ВШЭ
  • Книжный магазин «БукВышка»
  • Типография
  • Медиацентр
  • Журналы ВШЭ
  • Публикации
  • http://www.minobrnauki.gov.ru/
    Министерство науки и высшего образования РФ
  • https://edu.gov.ru/
    Министерство просвещения РФ
  • http://www.edu.ru
    Федеральный портал «Российское образование»
  • https://elearning.hse.ru/mooc
    Массовые открытые онлайн-курсы
  • НИУ ВШЭ1993–2026
  • Адреса и контакты
  • Условия использования материалов
  • Политика конфиденциальности
  • Правила применения рекомендательных технологий в НИУ ВШЭ
  • Карта сайта
Редактору