• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • A
  • A
  • A
  • A
  • A
Обычная версия сайта
  • RU
  • EN
  • Национальный исследовательский университет «Высшая школа экономики»
  • Публикации ВШЭ
  • Статьи
  • Тематическое моделирование для коротких текстов: сравнительный анализ
  • RU
  • EN
Расширенный поиск
Высшая школа экономики
Национальный исследовательский университет
Приоритетные направления
  • бизнес-информатика
  • государственное и муниципальное управление
  • гуманитарные науки
  • инженерные науки
  • компьютерно-математическое
  • математика
  • менеджмент
  • право
  • социология
  • экономика
по году
  • 2027
  • 2026
  • 2025
  • 2024
  • 2023
  • 2022
  • 2021
  • 2020
  • 2019
  • 2018
  • 2017
  • 2016
  • 2015
  • 2014
  • 2013
  • 2012
  • 2011
  • 2010
  • 2009
  • 2008
  • 2007
  • 2006
  • 2005
  • 2004
  • 2003
  • 2002
  • 2001
  • 2000
  • 1999
  • 1998
  • 1997
  • 1996
  • 1995
  • 1994
  • 1993
  • 1992
  • 1991
  • 1990
  • 1989
  • 1988
  • 1987
  • 1986
  • 1985
  • 1984
  • 1983
  • 1982
  • 1981
  • 1980
  • 1979
  • 1978
  • 1977
  • 1976
  • 1975
  • 1974
  • 1973
  • 1972
  • 1971
  • 1970
  • 1969
  • 1968
  • 1967
  • 1966
  • 1965
  • 1964
  • 1963
  • 1958
  • еще
Тематика
Новости
11 июня 2026 г.
Время жизни популяций определяется законами математики
Исследователи НИУ ВШЭ и МГУ доказали универсальный закон, описывающий время исчезновения популяций в случайной среде. Анализ эволюции ветвящихся процессов — сложных вероятностных систем — показал, что вне зависимости от изначального числа особей процесс вымирания подчиняется строгим математическим закономерностям. Результаты опубликованы в Journal of Applied Probability.
8 июня 2026 г.
«За 12 лет на нашем счету почти 1000 операций с пробуждением»
В НИУ ВШЭ прошла XIII Летняя нейролингвистическая школа, организованная Центром языка и мозга при поддержке факультета гуманитарных наук НИУ ВШЭ. В центре внимания слушателей была совместная работа нейролингвистов, нейрохирургов и нейрофизиологов в операционной, стандартизация лингвистических парадигм и практические подходы к сохранению речевой функции пациентов.
5 июня 2026 г.
Аспирантка НИУ ВШЭ открыла «невидимую» планировку античного Париона
Исследовательница из НИУ ВШЭ Идиль Малгиль изучила с помощью дрона с лазерным сканером сверхвысокого разрешения древнеримский город Парион, расположенный на территории современной Турции. Благодаря высокой плотности сканирования удалось зафиксировать крошечные неровности рельефа, скрытые под землей и растительностью. Обнаружены следы целых кварталов, террасных систем и стен, которые невозможно было различить ни при обычных раскопках, ни с помощью аэрофотосъемки. Результаты исследованияо публикованы в международном научном журнале Ancient Civilizations from Scythia to Siberia.

 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!

Публикации
  • Книги
  • Статьи
  • Главы в книгах
  • Препринты
  • Верификация публикаций
  • Расширенный поиск
  • Правила использования материалов
  • Наука в ВШЭ

?

Тематическое моделирование для коротких текстов: сравнительный анализ

Социология: методология, методы, математическое моделирование. 2023. № 56. С. 69–112.
Ващенко В. А.

Устойчивый рост популярности социальных сетей в качестве средства коммуникации актуализирует методологические вопросы, связанные с особенностями обработки коротких текстов, обладающих меньшим семантическим контекстом, чем крупные тексты, широко используемые для обучения и тестирования моделей машинного обучения для работы с текстовыми данными. Тематическое моделирование – метод машинного обучения «без учителя», нацеленный на агрегацию текстов в тематические кластеры – имеет множество академических и практических приложений в случаях отсутствия подробной разметки текстовых данных. Однако, качество работы алгоритмов тематического моделирования может ограничиваться полнотой семантического контекста, необходимого для качественного числового представления единицы текста. В этой статье рассматриваются 3 разных подхода к тематическому моделированию: классический LDА, обогащенный предобученными словарными эмбеддингами, тематическое моделирование на базе трансформерной модели BERT и сетевой подход к задаче тематического моделирования с использованием стохастических блокмоделей. Сравнивается качество работы указанных алгоритмов на наборе русскоязычных комментариев в сети TikTok и проводится формальная оценка скорости и когерентности результирующих тем.

Научное направление: Социология (включая демографию и антропологию) Медиа и коммуникации Компьютерные науки
Язык: русский
DOI
Ключевые слова: анализ текстовых данныхtopic modelingтематическое моделированиеприкладной сетевой анализapplied network analysistextual data analysis
ПУБЛИКАЦИЯ ПОДГОТОВЛЕНА ПО РЕЗУЛЬТАТАМ ПРОЕКТА:
Развитие сетевого анализа в России: адаптация теоретико-методологических подходов и практическое применение (2024)
Похожие публикации
Ценностная структура и материальный статус семьи как индикаторы и ресурсы устойчивости молодежи в трудной жизненной ситуации
Реан А. А., Шевченко А. О., Ставцев А. А. и др., Социальная психология и общество 2025 Т. 16 № 4 С. 49–70
Контекст и актуальность. Ценности играют значимую роль в процессах социализации и могут выступать психологическим ресурсом в трудных жизненных ситуациях в условиях ограниченного материального благополучия. Теоретической основой послужили модели ценностей Ш. Шварца и Р. Инглхарта, а также концепция экономической социализации. Цель исследования. Определить особенности ценностных ориентаций студентов в зависимости от субъективной оценки материального положения семьи. Гипотеза. Субъективное восприятие материального неблагополучия связано ...
Добавлено: 9 июня 2026 г.
Национальные рейтинги ответственного бизнеса России и Китая: сравнительный анализ и прогноз развития
Кривохижин О. Ю., Вукович Н. А., Смирнова В. А., Стандарты и качество 2026 № 5
В статье исследуются вопросы, касающиеся национальных рейтингов ответственного бизнеса Китая и России, выделяются их общие черты и существенные различия. В исследовании использовались методы количе ственного и качественного анализа данных национального российского ЭКГ-рейтинга за 2025 г. и китайского рейтинга ответственного бизнеса «Социальный кредит» (CSCS). Резуль таты анализа показали, что РФ и КНР являются лидерами стран БРИКС ...
Добавлено: 9 июня 2026 г.
Innovations in Information and Decision Sciences. Proceedings of the 13th International Conference on Frontiers in Intelligent Computing: Theory and Applications (FICTA 2025), Volume 4
Springer, 2026.
Добавлено: 8 июня 2026 г.
Некоммерческие организации в странах БРИКС: структура сектора и особенности развития
Гаврилов К. В., Заболотский А. В., Карташева А. А. и др., BRICS Expert Council-Russia, 2026.
Это исследование было подготовлено по инициативе Гражданского совета БРИКС с целью системного анализа сектора некоммерческих организаций (НКО) в странах объединения. По состоянию на февраль 2025 года в БРИКС входят десять государств: Бразилия, Египет, Индия, Индонезия, Иран, Китай, ОАЭ, Россия, Эфиопия, ЮАР. В рамках данной работы проведено детальное изучение сектора НКО в каждой из этих стран, что позволило выявить как ...
Добавлено: 5 июня 2026 г.
The non-profit sector in the BRICS countries: current structure and development trends. Executive Summary
Климов И. А., Чепелева М. Д., Гаврилов К. В. и др., Civil BRICS Council, 2026.
Данное исследование было проведено по инициативе Гражданского совета БРИКС с целью проведения системного анализа некоммерческого сектора (далее - "Сектор НКО"), охватывающего как некоммерческие организации (НКО), так и неправительственные организации (НПО), в каждой из стран - участниц БРИКС. С февраля 2025 года в состав БРИКС входят 10 государств-членов: Бразилия, Китай, Египет, Эфиопия, Индия, Индонезия, Иран, Россия, ...
Добавлено: 5 июня 2026 г.
Развитие малых городов России: «низовые» агенты активизации социального потенциала устойчивости
Недосека Е. В., Минина В. Н., Иванов С. А., Экономическая социология 2026 Т. 27 № 1 С. 125–152
Проблематика социально-экономического развития малых городов России уже значительное время находится в фокусе внимания исследователей, занимая не последнее место и в управленческой повестке. Однако использование исключительно управленческих или экономических мер воздействия не приносит ожидаемого результата. При этом и в научной литературе, и в управленческой практике не уделяется должного внимания таким вопросам, как типология хозяйствования и бытования ...
Добавлено: 4 июня 2026 г.
Объективна ли мораль? Классификация методов измерения обыденных метаэтических представлений
Михалёва В. Д., Социология: методология, методы, математическое моделирование 2026 Т. 35 № 1 С. 36–70
Статья посвящена исследованию и систематизации методов измерения обыденных представлений об объективности морали. Актуальность темы обусловлена растущим интересом к изучению того, как обычные люди, не имеющие философской подготовки, воспринимают природу моральных норм и их объективность. На основе анализа существующих подходов к измерению метаэтических представлений, автор показывает разнообразие методологических инструментов, применяемых в современных исследованиях. Показано, что наиболее ...
Добавлено: 4 июня 2026 г.
Proceedings of the 43rd International Conference on Machine Learning (ICML 2026)
Seul: PMLR, 2026.
Добавлено: 4 июня 2026 г.
Динамика распространенности потребления табака и никотина, пассивного курения среди взрослого населения Российской Федерации: репрезентативные национальные исследования 2009-2024 гг.
Салагай О. О., Сахарова Г. М., Антонов Н. С. и др., Медицина 2026 Т. 14 № 2 С. 42–57
Глобальным шагом в борьбе против табака было принятие в 2003 г. Рамочной конвенции ВОЗ по борьбе против табака (РКБТ), в комплекс мер которой включена организация мониторинга распространенности потребления табака. Основным условием мониторинга является его организация на базе репрезентативных обследований населения, отдельных его групп, а также с учетом новых форм табачной и никотинсодержащей продукции. В статье ...
Добавлено: 3 июня 2026 г.
How Universal is the Cool Water Effect? Evidence from the Unlikely Case of Russia
Кравцова М. В., Мусаев А. У., Вельцель К. П., / Series "SSRN Working Paper Series". 2026.
Добавлено: 3 июня 2026 г.
Значимые изменения в улусе Улюнхан, произошедшие за 20 лет: транзитивность традиционной культуры бурят и эвенков
Обухов А. С., Маерле М. А., Минаева Е. И., Исследователь/Researcher 2025 № 3-4 С. 282–299
В статье представлено первичное обобщение материалов экспедиции, проведенной в улусе Улюнхан эвенкийское Курумканского района Республики Бурятии в 2025 году в сравнении с материалами экспедиции 2005 года и основным фокусом внимания самих жителей улуса (бурят и эвенков) на изменениях, произошедших за 20 лет. Сравниваются изменения в различных аспектах жизни бурят и эвенков — технологическом, социальном, религиозном — как в обиходной ...
Добавлено: 2 июня 2026 г.
Подход к автоматическому распознаванию эмоций в транскрипциях речи
Двойникова А. А., Кондратенко К. О., Известия высших учебных заведений. Приборостроение 2023 Т. 66 № 10 С. 818–827
Аннотация. Исследован актуальный в различных областях вопрос распознавания эмоций в транскрипциях речи. Проанализировано влияние методов предобработки (удаление стоп-слов, лемматизация, стемминг) на точность распознавания эмоций в текстовых данных на русском и английском языках. Для проведения экспериментальных исследований использовались орфографические транскрипции диалогов из многомодальных корпусов RAMAS и CMU-MOSEI на русском и английском языке соответственно. Аннотирование этих корпусов ...
Добавлено: 25 апреля 2026 г.
Индекс актуальности темы профессионального выгорания
Завертяева М. А., Найденова Ю. Н., Киреечева А. Д., Социальная психология и общество 2026 Т. 17 № 1 С. 166–182
Контекст и актуальность. Профессиональное выгорание является значимой социальноэкономической проблемой, поэтому существует потребность в его регулярном мониторинге. Традиционно применяемые для измерения выгорания опросники трудозатратны и нерегулярны, что не позволяет использовать их для мониторинга проблемы на макроуровне. По аналогии с индексами на основе медиа в смежных областях настоящая работа рассматривает интенсивность упоминаний выгорания как индикатор общественной релевантности ...
Добавлено: 9 апреля 2026 г.
Эко-реальность и эко-образ российских регионов в пабликах социальной сети «В Контакте»
Немировская А. В., Муничкина О. П., Вестник Института социологии 2026 Т. 17 № 1 С. 183–208
В статье рассматривается медиа-репрезентация экологических проблем в шести российских регионах через призму региональных пабликов в социальной сети «ВКонтакте» с официальным и неофициальным статусом, функционирующих как онлайн-СМИ. На основе анализа контента новостных пабликов в «ВКонтакте» из шести российских регионов, включая как экологически благополучные, так и неблагополучные, рассмотрено, как экологические проблемы освещаются в данных субъектах РФ, и ...
Добавлено: 1 апреля 2026 г.
Эмодукты счастья: коммодификация и маркетинговые стратегии в популярной психологии
Маткин Н. А., Новикова А. А., Экономическая социология 2026 Т. 27 № 1 С. 92–124
На фоне роста спроса на психологические услуги в России и распространения терапевтической культуры цифровые платформы становятся ключевой площадкой для коммерциализации эмоций. Однако механизмы коммодификации эмоций, особенно счастья, на цифровых платформах ещё мало изучены. Данная статья анализирует, как популярные российские психологические блогеры конструируют, упаковывают и продают абстрактную идею «счастья» как стандартизированный рыночный продукт — эмодукт. Исследование ...
Добавлено: 2 февраля 2026 г.
Optimizing Modality Weights in Topic Models of Transactional Data
Хрыльченко К. Я., Воронцов К. В., Automation and Remote Control 2022 Vol. 83 No. 12 P. 1908–1922
Добавлено: 19 ноября 2025 г.
Interaction of Functional Brain Networks Is Associated With k-Clique Percolation in the Human Structural Connectome
Догонашева О. А., Захаров Д. Г., Tiselko V. и др., Human Brain Mapping 2025 Vol. 46 No. 15 Article e70343
Добавлено: 11 ноября 2025 г.
Анализ тематики повседневных разговоров: экспертный подход и автоматические методы
Шерстинова Т. Ю., Вепринцева Д. А., Человек: образ и сущность. Гуманитарные аспекты 2025 № 2(62) С. 89–108
В статье рассматриваются три разных подхода к изучению тематики повседневных разговоров: экспертная тематическая разметка и два автоматических метода (тематическое моделирование и кластеризация). Материалом для исследования послужили расшифровки русской устной повседневной речи из корпуса ОРД, подготовленные на основе звукозаписей спонтанных разговоров, выполненных в естественных коммуникативных ситуациях (дома, на работе, в учебном заведении, в магазине, в поликлинике ...
Добавлено: 3 сентября 2025 г.
Institutional Determinants and Emerging Trends in Foreign Market Entry Strategies by Small and Medium Enterprises: A Systematic Literature Review
Сикачев А. О., Веселова А. С., Управленец 2026 Vol. 17 No. 1 P. 65–83
Когда малые и средние предприятия (МСП) стремятся выйти за пределы своей страны, привлекательность международных рынков не вызывает сомнений. Однако на этом пути часто встречаются многочисленные препятствия, которые могут быть сложными для компаний, не имеющих опыта международной экспансии. Цель данной статьи - восполнить существующий пробел в литературе путем тщательного анализа институциональных факторов, влияющих на интернационализацию МСП, ...
Добавлено: 21 августа 2025 г.
Модификация языковой модели SBERT для выявления ESG-рисков на основе текстовых данных компаний и контрольно-надзорных мероприятий
Бузмаков А. В., Кирпищиков Д. А., Найденова Ю. Н. и др., Вестник Санкт-Петербургского университета. Серия 10. Прикладная математика. Информатика. Процессы управления 2025 Т. 21 № 1 С. 75–91
Разработан подход для выявления рисков, связанных с влиянием компаний на окружающую среду, социальной ответственностью и качеством управления (Environmental, Social and Governance — ESG-рисков), на основе собранной текстовой информации о компании. Для достижения этого предлагается модификация языковой модели SBERT с четко заданной функцией расстояния пространства эмбеддингов. Модель обучена на данных контрольно-надзорных мероприятий и текстов сайтов компаний. ...
Добавлено: 6 июня 2025 г.
From productivity to wellbeing? Topic modelling of doctoral education research
Смирнов Н. М., Higher Education 2026 Vol. 91 No. 3 P. 993–1021
Doctoral education has undergone significant transformations over the past two decades, driven by massification, internationalization, and the diversification of training models. These shifts have led to a growing body of research on doctoral education, yet little is known about the overarching thematic and geographical trends shaping this field. This study applies computational natural language processing ...
Добавлено: 26 мая 2025 г.
Цифровое моделирование тематического поля изучения социального капитала поколений в организациях
Волкова Н. В., Бордунос А. К., Чикер В. А. и др., Социальная психология и общество 2025 Т. 16 № 1 С. 5–27
Цель. Выявить ключевые темы, представленные в современных исследованиях о связи социального капитала с поколенческими различиями в организациях, применяя подходы диджитализации (цифрового моделирования) массива научных публикаций. Контекст и актуальность. Появление новых технологий, трудовая миграция и включенность представителей различных поколений в производственную деятельность актуализировали процесс непрерывной социализации индивидов в организационную среду и, соответственно, поиск социально-психологических инструментов для ее реализации. Цифровая ...
Добавлено: 5 мая 2025 г.
Войти через госуслуги? Факторы отношения к сервисам электронного правительства в социальных медиа
Егоров В. Ю., Филиппов И. Б., Ахременко А. С., Мониторинг общественного мнения: Экономические и социальные перемены 2025 № 1 С. 214–239
Фокус работы связан с общественным восприятием государственных практик в рамках политики цифровизации. Электронные практики взаимодействия с государством уже давно стали повседневными для большинства россиян: это подтверждается как опросами общественного мнения, так и высоким положением России в мировых рейтингах развития электронного правительства. В этих условиях появилось немало работ, направленных на изучение адаптации человека к новым цифровым ...
Добавлено: 1 мая 2025 г.
Censorship as a Dissociative Force: A Case of Sovremennik Magazine, 1847–1866
Vozhik E., Maslinsky K., Lisiukov R., CEUR Workshop Proceedings 2024 P. 938–949
Добавлено: 3 апреля 2025 г.
  • О ВЫШКЕ
  • Цифры и факты
  • Руководство и структура
  • Устойчивое развитие в НИУ ВШЭ
  • Преподаватели и сотрудники
  • Корпуса и общежития
  • Закупки
  • Обращения граждан в НИУ ВШЭ
  • Фонд целевого капитала
  • Противодействие коррупции
  • Сведения о доходах, расходах, об имуществе и обязательствах имущественного характера
  • Сведения об образовательной организации
  • Людям с ограниченными возможностями здоровья
  • Единая платежная страница
  • Работа в Вышке
  • ОБРАЗОВАНИЕ
  • Лицей
  • Довузовская подготовка
  • Олимпиады
  • Прием в бакалавриат
  • Вышка+
  • Прием в магистратуру
  • Аспирантура
  • Дополнительное образование
  • Центр развития карьеры
  • Бизнес-инкубатор ВШЭ
  • Образовательные партнерства
  • Обратная связь и взаимодействие с получателями услуг
  • НАУКА
  • Научные подразделения
  • Исследовательские проекты
  • Мониторинги
  • Диссертационные советы
  • Защиты диссертаций
  • Академическое развитие
  • Конкурсы и гранты
  • Внешние научно-информационные ресурсы
  • РЕСУРСЫ
  • Библиотека
  • Издательский дом ВШЭ
  • Книжный магазин «БукВышка»
  • Типография
  • Медиацентр
  • Журналы ВШЭ
  • Публикации
  • http://www.minobrnauki.gov.ru/
    Министерство науки и высшего образования РФ
  • https://edu.gov.ru/
    Министерство просвещения РФ
  • http://www.edu.ru
    Федеральный портал «Российское образование»
  • https://elearning.hse.ru/mooc
    Массовые открытые онлайн-курсы
  • НИУ ВШЭ1993–2026
  • Адреса и контакты
  • Условия использования материалов
  • Политика конфиденциальности
  • Правила применения рекомендательных технологий в НИУ ВШЭ
  • Карта сайта
Редактору