• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • A
  • A
  • A
  • A
  • A
Обычная версия сайта
  • RU
  • EN
  • Национальный исследовательский университет «Высшая школа экономики»
  • Публикации ВШЭ
  • Глава
  • Применение меры tf-idf и меры странности для выделения ключевых слов при классификации текстов научных статей
  • RU
  • EN
Расширенный поиск
Высшая школа экономики
Национальный исследовательский университет
Приоритетные направления
  • бизнес-информатика
  • государственное и муниципальное управление
  • гуманитарные науки
  • инженерные науки
  • компьютерно-математическое
  • математика
  • менеджмент
  • право
  • социология
  • экономика
по году
  • 2027
  • 2026
  • 2025
  • 2024
  • 2023
  • 2022
  • 2021
  • 2020
  • 2019
  • 2018
  • 2017
  • 2016
  • 2015
  • 2014
  • 2013
  • 2012
  • 2011
  • 2010
  • 2009
  • 2008
  • 2007
  • 2006
  • 2005
  • 2004
  • 2003
  • 2002
  • 2001
  • 2000
  • 1999
  • 1998
  • 1997
  • 1996
  • 1995
  • 1994
  • 1993
  • 1992
  • 1991
  • 1990
  • 1989
  • 1988
  • 1987
  • 1986
  • 1985
  • 1984
  • 1983
  • 1982
  • 1981
  • 1980
  • 1979
  • 1978
  • 1977
  • 1976
  • 1975
  • 1974
  • 1973
  • 1972
  • 1971
  • 1970
  • 1969
  • 1968
  • 1967
  • 1966
  • 1965
  • 1964
  • 1963
  • 1958
  • еще
Тематика
Новости
26 мая 2026 г.
Гибкость рынка труда как новая норма: ее формы и адаптация работников
Гибкий рынок труда, который наблюдается сегодня, — не временная тактика или вынужденная мера, а системный ответ на ряд вызовов. Как меняется карьера, какие формы гибкости встречаются и как работникам адаптироваться к ним, в колонке для IQ Медиа размышляет директор Института занятости и профессий НИУ ВШЭ Федор Прокопов.
25 мая 2026 г.
Биологи ВШЭ получили «молекулярный отпечаток» преэклампсии
Исследователи НИУ ВШЭ использовали новый способ моделирования состояния гипоксии в клетках плаценты при беременности, осложненной преэклампсией, и обнаружили молекулярные маркеры кислородного голодания тканей. Гипоксия — один из ключевых механизмов преэклампсии, полученные результаты важны для более точной и своевременной диагностики заболевания, а также для разработки эффективных методов лечения. Работа опубликована в журнале Placenta.
22 мая 2026 г.
Лаборатория живых смыслов: как проект НИУ ВШЭ и СахГУ переосмысляет труд
Проект «Зеркальные лаборатории» НИУ ВШЭ — Пермь и Сахалинского государственного университета (СахГУ) изучает, как культура, среда и технологии формируют и меняют трудовые смыслы. Исследование объединяет индивидуальный опыт, профессиональные нормы, городские проблемы, творческие практики и цифровые условия труда. Руководитель Лаборатории междисциплинарных исследований по антропологии труда НИУ ВШЭ в Перми Лилия Пантелеева рассказала о работе проекта.

 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!

Публикации
  • Книги
  • Статьи
  • Главы в книгах
  • Препринты
  • Верификация публикаций
  • Расширенный поиск
  • Правила использования материалов
  • Наука в ВШЭ

?

Применение меры tf-idf и меры странности для выделения ключевых слов при классификации текстов научных статей

С. 42–42.
Козлова Е. С., Романов А. Ю.

В рамках исследования используются две меры для выделения ключевых слов в наборе текстов: tf-idf и weirdness (мера странности). В исследовании используется выборка из более чем двадцати двух тысяч научных статей из девяти тем УДК. Задача исследования состояла в выделении оптимального набора слов для быстрой классификации заданного текста.

Язык: русский
Полный текст
Текст на другом сайте
Ключевые слова: УДКUDCTF-IDFTF-IDF

В книге

Информатика, математика, автоматика: 2016. Материалы научно-технической конференции
Сумы: СумДу, 2016.
Похожие публикации
Aschern at CheckThat! 2021: Lambda-Calculus of Fact-Checked Claims
Чернявский А. С., Ильвовский Д. А., Nakov P., , in: CLEF 2021 Working Notes.: CEUR Workshop Proceedings, 2021. P. 484–493.
Добавлено: 9 мая 2024 г.
Native Language Identification for Russian
Ремнев Н. В., , in: 2019 International Conference on Data Mining Workshops (ICDMW).: IEEE, 2019. P. 1–7.
Добавлено: 18 октября 2021 г.
Native Language Identification For Russian Using Errors Types
Ремнев Н. В., , in: Компьютерная лингвистика и интеллектуальные технологии: по материалам ежегодной международной конференции «Диалог» (Москва, 17–20 июня 2020 г.)Issue 19(26): дополнительный том.: -, 2020. P. 1123–1133.
Добавлено: 18 октября 2021 г.
Automatization of Scientific Articles Classification According to Universal Decimal Classifier
Романов А. Ю., Lomotin K.E., Kozlova E.S., , in: Supplementary Proceedings of the Sixth International Conference on Analysis of Images, Social Networks and Texts (AIST-SUP 2017), Moscow, Russia, July 27-29, 2017Vol. 1975.: Aachen: CEUR-WS.org, 2017. P. 122–133.
Добавлено: 28 ноября 2017 г.
Comparative analysis of classification methods for text in UDC code generation problem for scientific articles
Lomotin K. E., Kozlova E. S., Романов А. Ю., , in: Information Innovative Technologies: Materials of the International scientific–рractical conference.: M.: Association of graduates and employees of AFEA named after prof. Zhukovsky, 2017. P. 359–363.
Добавлено: 30 июля 2017 г.
Применение методов машинного обучения для решения задачи автоматической рубрикации статей по УДК
Романов А. Ю., Ломотин К. Е., Козлова Е. С., Информационные технологии 2017 Т. 23 № 6 С. 418–423
Работа посвящена исследованию применимости современных методов машинного обучения к задаче автоматической генерации кодов УДК научных статей. В качестве классификаторов рассматриваются такие модели, как искусственные нейронные сети, логистическая регрессия и бустинг. Разработаны графовые алгоритмы и прототип программного модуля для генерации кода УДК. ...
Добавлено: 30 июля 2017 г.
Применение современных методов классификации к рубрикации научных статей по УДК
Ломотин К. Е., Козлова Е. С., Колесниченко А. Л. и др., В кн.: Инновационные, информационные и коммуникационные технологии: сборник трудов XIII Международной научно-практической конференции.: М.: Ассоциация выпускников и сотрудников ВВИА им. проф. Жуковского, 2016. С. 92–95.
В статье анализируется эффективность применения современных средств классификации к задаче рубрикации текстов научных статей в соответствии с УДК. Исследуются следующие средства классификации: искусственные нейронные сети, наивный байесовский классификатор, деревья принятия решений и случайный лес. ...
Добавлено: 29 октября 2016 г.
Применение искусственной нейронной сети для рубрикации научных статей по УДК
Ломотин К. Е., Романов А. Ю., В кн.: Информатика, математика, автоматика: 2016. Материалы научно-технической конференции.: Сумы: СумДу, 2016. С. 43–43.
Использование искусственных нейронных сетей (ИНС) для решения задач классификации позволяет разделить такие сложные классы образов, какими являются темы классификатора УДК. Для проведения исследования нами выбран классификатор гиперплоскостной группы, реализованный в виде многослойного персептрона Розенблатта. ...
Добавлено: 11 июня 2016 г.
Research of Neural Networks Application Efficiency in Automatic Scientific Articles Classification According to UDC
Романов А. Ю., Lomotin K.E., Kozlova E.S. и др., , in: 2016 International Siberian Conference on Control and Communications (SIBCON). Proceedings.: M.: HSE, 2016. Ch. 543fu4t.
В данной работе рассмотрена реализация автоматической рубрикации текстов научных статей по классификатору UDC, проведено исследование эффективности применения  нейросетевых технологий для данной задачи. Предложены оптимальная архитектура и параметры нейронной сети. ...
Добавлено: 11 июня 2016 г.
Разработка рубрикатора информационно-образовательных ресурсов на основе УДК
Старых В. А., Белоозеров В. Н., Scientific and Technical Information Processing 2010 № 9 С. 25–34
Описан порядок работ и результаты разработки тематического рубрикатора информационно-образовательных ресурсов. В основу положена Универсальная десятичная классификация, имеющая международный статус и обязательная для  описания тематики научно-технической информации. На первом этапе заканчивается составление рубрикатора для тематики предметов общего среднего образования на основе требований государственных образовательных стандартов. ...
Добавлено: 14 октября 2013 г.
  • О ВЫШКЕ
  • Цифры и факты
  • Руководство и структура
  • Устойчивое развитие в НИУ ВШЭ
  • Преподаватели и сотрудники
  • Корпуса и общежития
  • Закупки
  • Обращения граждан в НИУ ВШЭ
  • Фонд целевого капитала
  • Противодействие коррупции
  • Сведения о доходах, расходах, об имуществе и обязательствах имущественного характера
  • Сведения об образовательной организации
  • Людям с ограниченными возможностями здоровья
  • Единая платежная страница
  • Работа в Вышке
  • ОБРАЗОВАНИЕ
  • Лицей
  • Довузовская подготовка
  • Олимпиады
  • Прием в бакалавриат
  • Вышка+
  • Прием в магистратуру
  • Аспирантура
  • Дополнительное образование
  • Центр развития карьеры
  • Бизнес-инкубатор ВШЭ
  • Образовательные партнерства
  • Обратная связь и взаимодействие с получателями услуг
  • НАУКА
  • Научные подразделения
  • Исследовательские проекты
  • Мониторинги
  • Диссертационные советы
  • Защиты диссертаций
  • Академическое развитие
  • Конкурсы и гранты
  • Внешние научно-информационные ресурсы
  • РЕСУРСЫ
  • Библиотека
  • Издательский дом ВШЭ
  • Книжный магазин «БукВышка»
  • Типография
  • Медиацентр
  • Журналы ВШЭ
  • Публикации
  • http://www.minobrnauki.gov.ru/
    Министерство науки и высшего образования РФ
  • https://edu.gov.ru/
    Министерство просвещения РФ
  • http://www.edu.ru
    Федеральный портал «Российское образование»
  • https://elearning.hse.ru/mooc
    Массовые открытые онлайн-курсы
  • НИУ ВШЭ1993–2026
  • Адреса и контакты
  • Условия использования материалов
  • Политика конфиденциальности
  • Правила применения рекомендательных технологий в НИУ ВШЭ
  • Карта сайта
Редактору