• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • A
  • A
  • A
  • A
  • A
Обычная версия сайта
  • RU
  • EN
  • Национальный исследовательский университет «Высшая школа экономики»
  • Публикации ВШЭ
  • Статьи
  • Тематическое моделирование для коротких текстов: сравнительный анализ
  • RU
  • EN
Расширенный поиск
Высшая школа экономики
Национальный исследовательский университет
Приоритетные направления
  • бизнес-информатика
  • государственное и муниципальное управление
  • гуманитарные науки
  • инженерные науки
  • компьютерно-математическое
  • математика
  • менеджмент
  • право
  • социология
  • экономика
по году
  • 2027
  • 2026
  • 2025
  • 2024
  • 2023
  • 2022
  • 2021
  • 2020
  • 2019
  • 2018
  • 2017
  • 2016
  • 2015
  • 2014
  • 2013
  • 2012
  • 2011
  • 2010
  • 2009
  • 2008
  • 2007
  • 2006
  • 2005
  • 2004
  • 2003
  • 2002
  • 2001
  • 2000
  • 1999
  • 1998
  • 1997
  • 1996
  • 1995
  • 1994
  • 1993
  • 1992
  • 1991
  • 1990
  • 1989
  • 1988
  • 1987
  • 1986
  • 1985
  • 1984
  • 1983
  • 1982
  • 1981
  • 1980
  • 1979
  • 1978
  • 1977
  • 1976
  • 1975
  • 1974
  • 1973
  • 1972
  • 1971
  • 1970
  • 1969
  • 1968
  • 1967
  • 1966
  • 1965
  • 1964
  • 1963
  • 1958
  • еще
Тематика
Новости
3 июля 2026 г.
Исследование НИУ ВШЭ: молодые россияне едут в крупные города за высшим образованием
За период с 2011 по 2021 год число переездов 18-летних россиян составило 1,2 млн человек. Из них 78% отправились в 160 крупных городов, что с большой долей вероятности связано с желанием получить высшее образование. Лидеры по формированию вузовских зон притяжения: Москва, Санкт-Петербург, Екатеринбург, Ростов-на-Дону, Краснодар, Новосибирск.
2 июля 2026 г.
Ученые НИУ ВШЭ в Санкт-Петербурге создали микролазер размером с бактерию
Международная команда исследователей при участии НИУ ВШЭ в Санкт-Петербурге создала микролазеры, излучающие в диапазоне глубокого ультрафиолета — 255 нанометров. Устройства работают при комнатной температуре, а диаметр самого маленького из них — около двух микрометров, что сопоставимо с размером бактерии. Такие лазеры могут применяться для сенсоров, спектроскопических систем, фотонных чипов и устройств связи. Работа опубликована в журнале Optics & Laser Technology.
1 июля 2026 г.
Ученые НИУ ВШЭ выяснили, кто и почему в России питается вне дома
Около трети населения (31,3%) практически не едят вне дома и не покупают готовую еду. Ядро активных потребителей — тех, кто питается вне дома или покупает готовое почти ежедневно или несколько раз в неделю, — составляет всего около 9%. Таковы результаты исследования, проведенного Институтом социальной политики НИУ ВШЭ. Как отмечают авторы, питание вне дома в России перестало быть маркером высокого статуса.

 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!

Публикации
  • Книги
  • Статьи
  • Главы в книгах
  • Препринты
  • Верификация публикаций
  • Расширенный поиск
  • Правила использования материалов
  • Наука в ВШЭ

?

Тематическое моделирование для коротких текстов: сравнительный анализ

Социология: методология, методы, математическое моделирование. 2023. № 56. С. 69–112.
Ващенко В. А.

Устойчивый рост популярности социальных сетей в качестве средства коммуникации актуализирует методологические вопросы, связанные с особенностями обработки коротких текстов, обладающих меньшим семантическим контекстом, чем крупные тексты, широко используемые для обучения и тестирования моделей машинного обучения для работы с текстовыми данными. Тематическое моделирование – метод машинного обучения «без учителя», нацеленный на агрегацию текстов в тематические кластеры – имеет множество академических и практических приложений в случаях отсутствия подробной разметки текстовых данных. Однако, качество работы алгоритмов тематического моделирования может ограничиваться полнотой семантического контекста, необходимого для качественного числового представления единицы текста. В этой статье рассматриваются 3 разных подхода к тематическому моделированию: классический LDА, обогащенный предобученными словарными эмбеддингами, тематическое моделирование на базе трансформерной модели BERT и сетевой подход к задаче тематического моделирования с использованием стохастических блокмоделей. Сравнивается качество работы указанных алгоритмов на наборе русскоязычных комментариев в сети TikTok и проводится формальная оценка скорости и когерентности результирующих тем.

Научное направление: Социология (включая демографию и антропологию) Медиа и коммуникации Компьютерные науки
Язык: русский
DOI
Ключевые слова: анализ текстовых данныхtopic modelingтематическое моделированиеприкладной сетевой анализapplied network analysistextual data analysis
ПУБЛИКАЦИЯ ПОДГОТОВЛЕНА ПО РЕЗУЛЬТАТАМ ПРОЕКТА:
Развитие сетевого анализа в России: адаптация теоретико-методологических подходов и практическое применение (2024)
Похожие публикации
Кодовые конструкции на базе обобщенных каскадных кодов для систем связи, использующих прием на основе порядковых статистик
Осипов Д. С., Информационно-управляющие системы 2026 № 3 С. 49–62
Введение: во многих проектируемых в настоящее время и перспективных системах связи методы оценивания характеристик канала и управления мощностью сигнала, разработанные для систем связи предыдущих поколений, не могут обеспечить требуемую точность оценивания и выравнивания мощности сигналов на приемном конце. Одним из вариантов решения этой проблемы является использование методов приема на основе порядковых статистик, которые не требуют управления мощностью ...
Добавлено: 3 июля 2026 г.
Информационно-медийное пространство мировой политики: учебное пособие. – 2-е изд., испр. и доп.
Репина Е. А., Багдасарьян Н. Г., Беликова А. А. и др., М.: КДУ, 2026.
Главная цель учебного пособия "Информационно-медийное пространство мировой политики" состоит в том, чтобы ознакомить учащихся с ключевыми теоретико-методологическими основами изучения медиа-информационного аспекта политических коммуникаций, а также сформировать у них набор компетенций, необходимых для практической работы со СМИ в сфере мировой политики и международных отношений. Учебное пособие предназначено для студентов и магистрантов вузов, обучающихся по специальностям международные ...
Добавлено: 2 июля 2026 г.
Пережить невиданные ИИ-перемены
Кузьминов Я. И., Кручинская Е. В., Россия в глобальной политике 2026 Т. 24 № 4 С. 92–109
В статье анализируется структурный разрыв между увеличивающейся когнитивной нагрузкой и снижающейся отдачей от неё. Подход, при котором развитие научных и образовательных школ, ориентированных на тренировку суждения, может стать альтернативой количественному наращиванию вычислительных мощностей, которое служит основной стратегией Китая и США. Применительно к России традиция фундаментального образования и сильных исследовательских школ приобретает в новых условиях значение ...
Добавлено: 1 июля 2026 г.
ОБРАЗ СТАРШЕГО ПОКОЛЕНИЯ В РОССИЙСКОМ ЦИФРОВОМ ДИСКУРСЕ О СЕМЬЕ
Григорьева М. В., Соколова Е. Н., Знак: проблемное поле медиаобразования 2026 № 1 С. 92–101
Статья анализирует дискурсивные репрезентации образов бабушек и дедушек в пользовательском контенте о семье российского сегмента социальных медиа. На материале корпуса более двух миллионов публичных сообщений за сентябрь 2023 - сентябрь 2024 годов, собранного через Brand Analytics, выделен подкорпус из 82 138 постов с упоминанием старшего поколения. Применены автоматизированное тематическое моделирование (LDA), кластерный анализ, описательная статистика ...
Добавлено: 30 июня 2026 г.
«Штраф за материнство»: влияние возраста рождения первого ребенка на заработную плату женщин
Родина О. А., Прикладная эконометрика 2026 № 82 С. 86–104
В статье изучается связь между возрастом рождения первенца и величиной «штрафа за материнство» в заработной плате. Панельная регрессия с фиксированными эффектами построена на данных Российского мониторинга экономического положения и здоровья населения (волны с 2006 по 2022 г.). В результате исследования выявлено, что рождение ребенка приводит к снижению заработной платы на 13.8%. Максимальная разница наблюдается среди ...
Добавлено: 30 июня 2026 г.
Financial literacy and over-indebtedness: Is there a relationship?
Кузина О. Е., Моисеева Д. В., Абдураманов А. Я., Russian Journal of Economics 2026 Vol. 2 No. 12 P. 251–273
Добавлено: 30 июня 2026 г.
Иран и его соседи
Громова А. В., М.: КноРус, 2023.
Учебное пособие по лингвострановедению предназначено для востоковедов, изучающих персидский язык в рамках различных специализаций: регионоведение, филология, история и политология, экономическое развитие стран Ближнего и Среднего Востока. Пособие знакомит с реалиями современной иранской жизни и национальными новостными ресурсами, широко использует материалы Интернета. Книга оставляет известную свободу в выборе материала для занятий в зависимости от уровня владения ...
Добавлено: 29 июня 2026 г.
User-Driven Fact-Checking Behavior, Motivational Barriers and Expertise Asymmetry in Health Communication: A Large-Scale Online Experiment
Артёменко Е. Д., Кольцова Е. Ю., Terpilovskii M., Journal of Health Communication 2026
Добавлено: 29 июня 2026 г.
Младенческая смертность в регионах России в 1927-2022 гг.
Кузнецова П. О., Демографическое обозрение 2026 Т. 13 № 2 С. 37–70
В работе представлен анализ динамики и факторов младенческой смертности в регионах России в 1927-2022 гг., проведенный на данных Демоскоп Weekly и Российской базы данных по рождаемости и смертности. Несмотря на значимость регионального фактора в младенческой смертности, особенно на ранних этапах наблюдаемого временного отрезка, эффект периода, как правило, оказывался важнее. Так, значительные успехи в снижении младенческой ...
Добавлено: 29 июня 2026 г.
МЕДИАТИЗАЦИЯ ЗНАКОМСТВА: ДОЦИФРОВЫЕ ТЕХНОЛОГИИ КОММУНИКАЦИИ И ТРАНСФОРМАЦИЯ РОМАНТИЧЕСКИХ РИТУАЛОВ
Рубан М. Г., Кожемякин Е. А., Коммуникативные исследования 2026 Т. 13 № 2 С. 325–341
Статья посвящена исследованию медиатизации романтического знакомства в доцифровую эпоху. Авторы обращают внимание на дисбаланс исследовательского интереса, обращенного преимущественно на практики цифрового знакомства, беспрецедентный характер медиатизации которого часто бывает гиперболизирован. В работе рассматриваются исторически устойчивые модели знакомства, опосредованные коммуникационными технологиями, характерными для доцифровой эпохи. Авторы применяют историко-генетический метод на основании вторичного (монографии и статьи) и архивного ...
Добавлено: 29 июня 2026 г.
The 12th International Conference on Information Technology and Quantitative Management (ITQM 2025)
Netherlands: ScienceDirect, 2025.
Добавлено: 28 июня 2026 г.
Object-centric process management: A research manifesto
Seidel A., Weske M., Montali M. и др., Information Systems 2026 Vol. 141 Article 102728
Добавлено: 27 июня 2026 г.
2024 26th International Conference on Digital Signal Processing and its Applications (DSPA)
IEEE, 2024.
Добавлено: 27 июня 2026 г.
Построение методик оценки качества восприятия (QOE) потокового видео
Ивченко А. В., Дворкович А. В., Телекоммуникации 2020 Т. 12 С. 2–11
Технология Dynamic Adaptive Streaming over HTTP (DASH) обеспечивает работу большинства мультимедийных сервисов, ее особенности (повторные буферизации, переключения качества и др.) приводят к необходимости создания специализированных методик оценки пользовательского, субъективного качества восприятия Quality of Experience (QoE) на основе объективных параметров. В данной статье исследуется влияние различных метрик на QoE и приводятся модели оценки с коэффициентом корреляции ...
Добавлено: 27 июня 2026 г.
Exploitation in rent systems: relational inequality between and within organizations
Шамс С., International Review of Sociology 2026 Vol. 36 No. 1 P. 262–289
Добавлено: 27 июня 2026 г.
Living in techno/digital/neo-feudalist times
Шамс С., International Sociology 2026 Vol. 4 No. 2 P. 183–190
Добавлено: 27 июня 2026 г.
Платформа, управляемая событиями, для интеграции компонентов машинного зрения с операционным центром.
Гаджимирзаев Ш. М., Хельвас А. В., 2023 3rd International Conference on Innovative Research in Applied Science, Engineering and Technology (IRASET) Mohammedia, Morocco 2023 P. 1–6
В статье предлагается архитектура событийно-управляемого Центра экстренного реагирования с компонентом компьютерного зрения. Анализируются источники информации и обсуждаются подходы к использованию событий компьютерного зрения для обнаружения и оценки тактических ситуаций. Сообщения от компонентов компьютерного зрения преобразуются в Протокол общих оповещений (Common Alerting Protocol) и обрабатываются средой Центра управления для распознавания тактических ситуаций. ...
Добавлено: 26 июня 2026 г.
Дискретное моделирование процесса восстановительного ремонта участка дороги
Гаджимирзаев Ш. М., Хельвас А. В., Компьютерные исследования и моделирование 2022 Т. 14 № 6 С. 1255–1268
абота содержит описание результатов моделирования процесса поддержания готовности участка дорожной сети в условиях воздействия с заданными параметрами. Рассматривается одномерный участок дороги длиной до 40 км с общим количеством ударов до 100 в течение рабочей смены бригады. Разработана имитационная модель проведения работ по его поддержанию в рабочем состоянии несколькими группами (инженерными бригадами), входящими в состав инженерно-дорожного ...
Добавлено: 26 июня 2026 г.
Подход к автоматическому распознаванию эмоций в транскрипциях речи
Двойникова А. А., Кондратенко К. О., Известия высших учебных заведений. Приборостроение 2023 Т. 66 № 10 С. 818–827
Аннотация. Исследован актуальный в различных областях вопрос распознавания эмоций в транскрипциях речи. Проанализировано влияние методов предобработки (удаление стоп-слов, лемматизация, стемминг) на точность распознавания эмоций в текстовых данных на русском и английском языках. Для проведения экспериментальных исследований использовались орфографические транскрипции диалогов из многомодальных корпусов RAMAS и CMU-MOSEI на русском и английском языке соответственно. Аннотирование этих корпусов ...
Добавлено: 25 апреля 2026 г.
Индекс актуальности темы профессионального выгорания
Завертяева М. А., Найденова Ю. Н., Киреечева А. Д., Социальная психология и общество 2026 Т. 17 № 1 С. 166–182
Контекст и актуальность. Профессиональное выгорание является значимой социальноэкономической проблемой, поэтому существует потребность в его регулярном мониторинге. Традиционно применяемые для измерения выгорания опросники трудозатратны и нерегулярны, что не позволяет использовать их для мониторинга проблемы на макроуровне. По аналогии с индексами на основе медиа в смежных областях настоящая работа рассматривает интенсивность упоминаний выгорания как индикатор общественной релевантности ...
Добавлено: 9 апреля 2026 г.
Эко-реальность и эко-образ российских регионов в пабликах социальной сети «В Контакте»
Немировская А. В., Муничкина О. П., Вестник Института социологии 2026 Т. 17 № 1 С. 183–208
В статье рассматривается медиа-репрезентация экологических проблем в шести российских регионах через призму региональных пабликов в социальной сети «ВКонтакте» с официальным и неофициальным статусом, функционирующих как онлайн-СМИ. На основе анализа контента новостных пабликов в «ВКонтакте» из шести российских регионов, включая как экологически благополучные, так и неблагополучные, рассмотрено, как экологические проблемы освещаются в данных субъектах РФ, и ...
Добавлено: 1 апреля 2026 г.
Эмодукты счастья: коммодификация и маркетинговые стратегии в популярной психологии
Маткин Н. А., Новикова А. А., Экономическая социология 2026 Т. 27 № 1 С. 92–124
На фоне роста спроса на психологические услуги в России и распространения терапевтической культуры цифровые платформы становятся ключевой площадкой для коммерциализации эмоций. Однако механизмы коммодификации эмоций, особенно счастья, на цифровых платформах ещё мало изучены. Данная статья анализирует, как популярные российские психологические блогеры конструируют, упаковывают и продают абстрактную идею «счастья» как стандартизированный рыночный продукт — эмодукт. Исследование ...
Добавлено: 2 февраля 2026 г.
Optimizing Modality Weights in Topic Models of Transactional Data
Хрыльченко К. Я., Воронцов К. В., Automation and Remote Control 2022 Vol. 83 No. 12 P. 1908–1922
Добавлено: 19 ноября 2025 г.
Interaction of Functional Brain Networks Is Associated With k-Clique Percolation in the Human Structural Connectome
Догонашева О. А., Захаров Д. Г., Tiselko V. и др., Human Brain Mapping 2025 Vol. 46 No. 15 Article e70343
Добавлено: 11 ноября 2025 г.
  • О ВЫШКЕ
  • Цифры и факты
  • Руководство и структура
  • Устойчивое развитие в НИУ ВШЭ
  • Преподаватели и сотрудники
  • Корпуса и общежития
  • Закупки
  • Обращения граждан в НИУ ВШЭ
  • Фонд целевого капитала
  • Противодействие коррупции
  • Сведения о доходах, расходах, об имуществе и обязательствах имущественного характера
  • Сведения об образовательной организации
  • Людям с ограниченными возможностями здоровья
  • Единая платежная страница
  • Работа в Вышке
  • ОБРАЗОВАНИЕ
  • Лицей
  • Довузовская подготовка
  • Олимпиады
  • Прием в бакалавриат
  • Вышка+
  • Прием в магистратуру
  • Аспирантура
  • Дополнительное образование
  • Центр развития карьеры
  • Бизнес-инкубатор ВШЭ
  • Образовательные партнерства
  • Обратная связь и взаимодействие с получателями услуг
  • НАУКА
  • Научные подразделения
  • Исследовательские проекты
  • Мониторинги
  • Диссертационные советы
  • Защиты диссертаций
  • Академическое развитие
  • Конкурсы и гранты
  • Внешние научно-информационные ресурсы
  • РЕСУРСЫ
  • Библиотека
  • Издательский дом ВШЭ
  • Книжный магазин «БукВышка»
  • Типография
  • Медиацентр
  • Журналы ВШЭ
  • Публикации
  • http://www.minobrnauki.gov.ru/
    Министерство науки и высшего образования РФ
  • https://edu.gov.ru/
    Министерство просвещения РФ
  • http://www.edu.ru
    Федеральный портал «Российское образование»
  • https://elearning.hse.ru/mooc
    Массовые открытые онлайн-курсы
  • НИУ ВШЭ1993–2026
  • Адреса и контакты
  • Условия использования материалов
  • Политика конфиденциальности
  • Правила применения рекомендательных технологий в НИУ ВШЭ
  • Карта сайта
Редактору