• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • A
  • A
  • A
  • A
  • A
Обычная версия сайта
  • RU
  • EN
  • Национальный исследовательский университет «Высшая школа экономики»
  • Публикации ВШЭ
  • Глава
  • Prediction of News Popularity via Keywords Extraction and Trends Tracking
  • RU
  • EN
Расширенный поиск
Высшая школа экономики
Национальный исследовательский университет
Приоритетные направления
  • бизнес-информатика
  • государственное и муниципальное управление
  • гуманитарные науки
  • инженерные науки
  • компьютерно-математическое
  • математика
  • менеджмент
  • право
  • социология
  • экономика
по году
  • 2027
  • 2026
  • 2025
  • 2024
  • 2023
  • 2022
  • 2021
  • 2020
  • 2019
  • 2018
  • 2017
  • 2016
  • 2015
  • 2014
  • 2013
  • 2012
  • 2011
  • 2010
  • 2009
  • 2008
  • 2007
  • 2006
  • 2005
  • 2004
  • 2003
  • 2002
  • 2001
  • 2000
  • 1999
  • 1998
  • 1997
  • 1996
  • 1995
  • 1994
  • 1993
  • 1992
  • 1991
  • 1990
  • 1989
  • 1988
  • 1987
  • 1986
  • 1985
  • 1984
  • 1983
  • 1982
  • 1981
  • 1980
  • 1979
  • 1978
  • 1977
  • 1976
  • 1975
  • 1974
  • 1973
  • 1972
  • 1971
  • 1970
  • 1969
  • 1968
  • 1967
  • 1966
  • 1965
  • 1964
  • 1963
  • 1958
  • еще
Тематика
Новости
28 мая 2026 г.
«Мне нравятся самосбывающиеся пророчества»
Андрей Ворчик изучает счастье, читает научпоп-лекции и хочет, чтобы наука занималась в том числе общественными проблемами. В интервью проекту «Молодые ученые Вышки» он рассказал о том, как эмоции влияют на принятие решений, Бермудском треугольнике из ванной, холодильника и кровати и идеальной формуле образования.
28 мая 2026 г.
Карманные деньги, интерес и семья: что влияет на экономическую грамотность студентов
Экономическая грамотность студентов зависит не только от профильного образования, но и от интереса к экономике, учебной среды и финансовых практик в семье. Так, студенты, получавшие карманные деньги нерегулярно, в среднем лучше справляются с тестами по экономической грамотности, чем их сверстники с постоянной финансовой поддержкой. Это показало исследование НИУ ВШЭ на выборке более 1100 студентов из пяти российских университетов. Результаты работы опубликованы в журнале Cakrawala Pendidikan.
27 мая 2026 г.
Нейросетевое отображение как метод создания математических моделей
Ученые НИУ ВШЭ в Нижнем Новгороде и Белградского института физики (Сербия) совместно изучают возможности применения методов машинного обучения и использования нейросетей в исследованиях нелинейной динамики. О международном проекте «Вышке.Главное» рассказала его руководитель от ВШЭ, ведущий научный сотрудник Лаборатории топологических методов в динамике факультета информатики, математики и компьютерных наук НИУ ВШЭ в Нижнем Новгороде Наталия Станкевич.

 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!

Публикации
  • Книги
  • Статьи
  • Главы в книгах
  • Препринты
  • Верификация публикаций
  • Расширенный поиск
  • Правила использования материалов
  • Наука в ВШЭ

?

Prediction of News Popularity via Keywords Extraction and Trends Tracking

Ch. 4. P. 37–51.
Alexander Pugachev, Voronov A., Макаров И. А.

In the last years, news agencies have become more influential in various social groups. At the same time, the media industry starts to monetize online distributed articles with contextual advertising. However, the efficiency of online marketing highly depends on the popularity of news articles. In our work, we present an alternative and effective way for article popularity forecasting with two–step approach: article keywords extraction and keywords-based article popularity prediction. We show the benefits of this technique and compare with widely used methods, such as Text Embeddings and BERT–based methods. Moreover, the work provides an architecture of the model for dynamic keyword tracking trained on the newest dataset of Russian news articles with more than 280k articles and 22k keywords for the popularity of forecasting purposes.

Язык: английский
Полный текст
DOI
Текст на другом сайте
Ключевые слова: обработка текстов на естественном языкеkeyword extractionOnline news popularity forecastingPopularity predictionBERTText embeddingпредсказание популярности новостей

В книге

Recent Trends in Analysis of Images, Social Networks and Texts. 9th International Conference, AIST 2020, Skolkovo, Moscow, Russia, October 15–16, 2020 Revised Supplementary Proceedings
Vol. 12602. , Springer, 2021.
Похожие публикации
Development of a Language Model for Automated Classification of English-Language Scientific Articles by SRSTI Codes
V. V. Zunin, A. I. Afonin, V. I. Anoshin и др., Automatic Documentation and Mathematical Linguistics 2025 Vol. 59 No. 5 P. 287–293
Добавлено: 11 февраля 2026 г.
The Impact of Alternative Data on Default Probability: Analyzing the Italian E-commerce Sector with NLP and Network Structures
Bernhardt B. D., Marciano C., Гуаррачино М. Р., Operations Research Forum 2025 Vol. 6 Article 47
Добавлено: 6 сентября 2025 г.
Shrink the Longest: Improving Latent Space Isotropy with Simplicial Geometry
Кудряшов С. А., Karpik O., Клышинский Э. С., , in: Analysis of Images, Social Networks and Texts, 12th International Conference, AIST 2024, Bishkek, Kyrgyzstan, October 17–19, 2024, Revised Selected PapersVol. 15419.: Springer, 2024. P. 120–130.
Добавлено: 29 мая 2025 г.
Индекс этичности российских банков на основе искусственного интеллекта
Сторчевой М. А., Паршаков П. А., Паклина С. Н. и др., Доклады Российской академии наук. Математика, информатика, процессы управления (ранее - Доклады Академии Наук. Математика) 2024 Т. 520 № 6 С. 70–81
Измерение этичности компании является важным элементом в механизме регулирования поведения участников рынка, поскольку позволяет потребителям и регулирующим органам принимать более эффективные решения, что оказывает дисциплинирующее воздействие на компании. Мы протестировали различные способы машинного анализа отзывов потребителей российских банков и разработали Индекс этичности, который позволяет на основе отзывов потребителей рассчитывать количественную оценку этичности трех сотен российских ...
Добавлено: 31 октября 2024 г.
The More Polypersonal the Better - A Short Look on Space Geometry of Fine-Tuned Layers
Sergei Kudriashov, Veronika Zykova, Степанова А. М. и др., , in: Advances in Neural Computation, Machine Learning, and Cognitive Research VIII, Selected Papers from the XXVI International Conference on Neuroinformatics, October 21-25, 2024, Moscow, RussiaVol. VIII.: Cham: Springer, 2024. P. 13–22.
Добавлено: 24 октября 2024 г.
Regional inflation analysis using social network data
Shcherbakov, V., Карпов И. А., Economy of Regions 2024 Vol. 20 No. 3 P. 930–946
Добавлено: 7 декабря 2023 г.
Grammar in Language Models: BERT Study
Chistyakova K., Kazakova Tatiana, / NRU HSE. Series WP BRP "Linguistics". 2023. No. 115.
Добавлено: 29 ноября 2023 г.
Classification of Short Scientific Texts
I. K. Kusakin, Fedorets O. V., A. Y. Romanov, Scientific and Technical Information Processing 2023 Vol. 50 No. 3 P. 176–183
Добавлено: 4 ноября 2023 г.
Identifying and Visualizing Trends in Science, Technology, and Innovation Using SciBERT
Лобанова П. А., Bakhtin P., Sergienko Y., IEEE Transactions on Engineering Management 2024 No. 71 P. 11898–11906
Добавлено: 8 сентября 2023 г.
How to detect propaganda from social media? Exploitation of semantic and fine-tuned language models
Малик М. Ш., Imran T., Mona Mamdouh J., PeerJ Computer Science 2023 Vol. 9 Article e1248
Добавлено: 4 сентября 2023 г.
Automated defect identification for cell phones using language context, linguistic and smoke-word models
Muhammad Z. Y., Малик М. Ш., Игнатов Д. И., Expert Systems with Applications 2023 Vol. 227 Article 120236
Добавлено: 13 июня 2023 г.
Computational Experiments on Detecting Meaning shift in Jokes
Eugeniia Zakovorotnaia, , in: 2022 IEEE International Multi-Conference on Engineering, Computer and Information Sciences (SIBIRCON).: Ekaterinburg: IEEE, 2022. P. 840–843.
Добавлено: 10 мая 2023 г.
Использование BERT для классификации коротких научных текстов на русском языке
Кусакин И. К., Цурупа А. М., Алмакаев А. В. и др., В кн.: НТИ-2022. Научная информация в современном мире: глобальные вызовы и национальные приоритеты : материалы 10-ой научной конференции с международным участием, посвященной 70-летию ВИНИТИ РАН, Москва, 25–26 октября 2022 года.: М.: ВИНИТИ РАН, 2022. С. 103–109.
В данной работе рассматриваются подходы к обучению классификаторов научных статей на основе BERT с целью реализации приложения для адаптации лучших моделей для последующего использования в инфраструктуре ВИНИТИ РАН. Для этого лингвистическая модель BERT была обучена на специализированном корпусе научных текстов для последующего использования в качестве встроенной части классификатора. В работе приведены результаты экспериментов по обучению ...
Добавлено: 31 января 2023 г.
Исследование методов машинного обучения для классификации научных текстов на русском языке
Кусакин И. К., Федорец О. В., Романов А. Ю., Научно-техническая информация. Серия 2: Информационные процессы и системы 2022 Т. 12 С. 6–9
В данной работе рассматриваются современные подходы к обработке естественного языка и применения технологий искусственного интеллекта в задаче классификации научных текстов на русском языке. Работа посвящена анализу реализаций методов векторизации текстовой информации применительно к задаче обучения различных моделей классификаторов: от классических алгоритмов машинного обучения до нейросетевых архитектур-трансформеров. ...
Добавлено: 31 января 2023 г.
Opinion Mining for Modeling User Experience of Online Education: Sentiment Analysis and Keywords Extraction of Student Reviews
Москвина А. Д., Кирина М. А., Anastasia Gavrilyuk, , in: 2022 32nd Conference of Open Innovations Association (FRUCT).: IEEE, 2022. P. 187–195.
Добавлено: 9 декабря 2022 г.
SocialBERT – Transformers for Online Social Network Language Modelling
Ilia Karpov, Nick Kartashev, , in: Analysis of Images, Social Networks and Texts. 10th International Conference, AIST 2021, Tbilisi, Georgia, December 16–18, 2021, Revised Selected Papers.: Cham: Springer, 2022. P. 1–10.
Добавлено: 31 октября 2021 г.
BERT for Sequence-to-Sequence Multi-label Text Classification.
Яруллин Р. И., Serdyukov P., , in: Analysis of Images, Social Networks and Texts: 9th International Conference, AIST 2020, Skolkovo, Moscow, Russia, October 15–16, 2020, Revised Selected PapersVol. 12602.: Springer, 2021. P. 187–198.
Добавлено: 4 октября 2021 г.
Named Entity Recognition from Chernobyl Documentaries
Daniil Tikhomirov, Nikitinsky N., Макаров И. А., , in: Proceedings of the Conference on Modeling and Analysis of Complex Systems and Processes 2020 (MACSPro 2020)Vol. 2795.: CEUR Workshop Proceedings, 2020. P. 133–139.
The paper describes a system that extracts facts and opinions from documentary texts to create a domain ontology of a controversial topic for Chernobyl disaster. The pipeline of the system is based on RNNbased NER module, which was tested on an annotated text corpora. ...
Добавлено: 4 января 2021 г.
Comparative Study Of Data Clustering Algorithms And Analysis Of The Keywords Extraction Efficiency: Learner Corpus Case
Щербакова А. М., / NRU HSE. Series WP BRP "Linguistics". 2020.
Добавлено: 2 декабря 2020 г.
Keyphrase extraction from the Russian corpus on linguistics by means of KEA and RAKE algorithms
Moskvina Anna, Sokolova E., Mitrofanova O., , in: Data Analytics and Management in Data Intensive Domains. Proceedings of the XX International Conference – DAMDID/RCDL’2018, October 9-12, 2018, Moscow.: M.: FRC CSC RAS, 2018. P. 369–372.
Добавлено: 29 сентября 2020 г.
  • О ВЫШКЕ
  • Цифры и факты
  • Руководство и структура
  • Устойчивое развитие в НИУ ВШЭ
  • Преподаватели и сотрудники
  • Корпуса и общежития
  • Закупки
  • Обращения граждан в НИУ ВШЭ
  • Фонд целевого капитала
  • Противодействие коррупции
  • Сведения о доходах, расходах, об имуществе и обязательствах имущественного характера
  • Сведения об образовательной организации
  • Людям с ограниченными возможностями здоровья
  • Единая платежная страница
  • Работа в Вышке
  • ОБРАЗОВАНИЕ
  • Лицей
  • Довузовская подготовка
  • Олимпиады
  • Прием в бакалавриат
  • Вышка+
  • Прием в магистратуру
  • Аспирантура
  • Дополнительное образование
  • Центр развития карьеры
  • Бизнес-инкубатор ВШЭ
  • Образовательные партнерства
  • Обратная связь и взаимодействие с получателями услуг
  • НАУКА
  • Научные подразделения
  • Исследовательские проекты
  • Мониторинги
  • Диссертационные советы
  • Защиты диссертаций
  • Академическое развитие
  • Конкурсы и гранты
  • Внешние научно-информационные ресурсы
  • РЕСУРСЫ
  • Библиотека
  • Издательский дом ВШЭ
  • Книжный магазин «БукВышка»
  • Типография
  • Медиацентр
  • Журналы ВШЭ
  • Публикации
  • http://www.minobrnauki.gov.ru/
    Министерство науки и высшего образования РФ
  • https://edu.gov.ru/
    Министерство просвещения РФ
  • http://www.edu.ru
    Федеральный портал «Российское образование»
  • https://elearning.hse.ru/mooc
    Массовые открытые онлайн-курсы
  • НИУ ВШЭ1993–2026
  • Адреса и контакты
  • Условия использования материалов
  • Политика конфиденциальности
  • Правила применения рекомендательных технологий в НИУ ВШЭ
  • Карта сайта
Редактору