?
Применение меры tf-idf и меры странности для выделения ключевых слов при классификации текстов научных статей
С. 42-42.
Козлова Е. С., Романов А. Ю.
В рамках исследования используются две меры для выделения ключевых слов в наборе текстов: tf-idf и weirdness (мера странности). В исследовании используется выборка из более чем двадцати двух тысяч научных статей из девяти тем УДК. Задача исследования состояла в выделении оптимального набора слов для быстрой классификации заданного текста.
В книге
Сумы : СумДу, 2016
Романов А. Ю., Lomotin K.E., Kozlova E.S. и др., , in : 2016 International Siberian Conference on Control and Communications (SIBCON). Proceedings. : M. : HSE, 2016. Ch. 543fu4t.
В данной работе рассмотрена реализация автоматической рубрикации текстов научных статей по классификатору UDC, проведено исследование эффективности применения нейросетевых технологий для данной задачи. Предложены оптимальная архитектура и параметры нейронной сети. ...
Добавлено: 11 июня 2016 г.
Ломотин К. Е., Романов А. Ю., В кн. : Информатика, математика, автоматика: 2016. Материалы научно-технической конференции. : Сумы : СумДу, 2016. С. 43-43.
Использование искусственных нейронных сетей (ИНС) для решения задач классификации позволяет разделить такие сложные классы образов, какими являются темы классификатора УДК. Для проведения исследования нами выбран классификатор гиперплоскостной группы, реализованный в виде многослойного персептрона Розенблатта. ...
Добавлено: 11 июня 2016 г.
Романов А. Ю., Lomotin K.E., Kozlova E.S., , in : Supplementary Proceedings of the Sixth International Conference on Analysis of Images, Social Networks and Texts (AIST-SUP 2017), Moscow, Russia, July 27-29, 2017. Vol. 1975.: Aachen : CEUR-WS.org, 2017. P. 122-133.
Добавлено: 28 ноября 2017 г.
Работа посвящена исследованию применимости современных методов машинного обучения к задаче автоматической генерации кодов УДК научных статей. В качестве классификаторов рассматриваются такие модели, как искусственные нейронные сети, логистическая регрессия и бустинг. Разработаны графовые алгоритмы и прототип программного модуля для генерации кода УДК. ...
Добавлено: 30 июля 2017 г.
Ломотин К. Е., Козлова Е. С., Колесниченко А. Л. и др., В кн. : Инновационные, информационные и коммуникационные технологии: сборник трудов XIII Международной научно-практической конференции. : М. : Ассоциация выпускников и сотрудников ВВИА им. проф. Жуковского, 2016. С. 92-95.
В статье анализируется эффективность применения современных средств классификации к задаче рубрикации текстов научных статей в соответствии с УДК. Исследуются следующие средства классификации: искусственные нейронные сети, наивный байесовский классификатор, деревья принятия решений и случайный лес. ...
Добавлено: 29 октября 2016 г.
Lomotin K. E., Kozlova E. S., Романов А. Ю., , in : Information Innovative Technologies: Materials of the International scientific–рractical conference. : M. : Association of graduates and employees of AFEA named after prof. Zhukovsky, 2017. P. 359-363.
Добавлено: 30 июля 2017 г.
Ремнев Н. В., , in : 2019 International Conference on Data Mining Workshops (ICDMW). : IEEE, 2019. P. 1-7.
Добавлено: 18 октября 2021 г.
Старых В. А., Белоозеров В. Н., Scientific and Technical Information Processing 2010 № 9 С. 25-34
Описан порядок работ и результаты разработки тематического рубрикатора информационно-образовательных ресурсов. В основу положена Универсальная десятичная классификация, имеющая международный статус и обязательная для описания тематики научно-технической информации. На первом этапе заканчивается составление рубрикатора для тематики предметов общего среднего образования на основе требований государственных образовательных стандартов. ...
Добавлено: 14 октября 2013 г.
Ремнев Н. В., , in : Компьютерная лингвистика и интеллектуальные технологии: по материалам ежегодной международной конференции «Диалог» (Москва, 17–20 июня 2020 г.). Issue 19(26): дополнительный том.: -, 2020. P. 1123-1133.
Добавлено: 18 октября 2021 г.