• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • A
  • A
  • A
  • A
  • A
Обычная версия сайта
  • RU
  • EN
  • Национальный исследовательский университет «Высшая школа экономики»
  • Публикации ВШЭ
  • Статьи
  • Тематическое моделирование для коротких текстов: сравнительный анализ
  • RU
  • EN
Расширенный поиск
Высшая школа экономики
Национальный исследовательский университет
Приоритетные направления
  • бизнес-информатика
  • государственное и муниципальное управление
  • гуманитарные науки
  • инженерные науки
  • компьютерно-математическое
  • математика
  • менеджмент
  • право
  • социология
  • экономика
по году
  • 2027
  • 2026
  • 2025
  • 2024
  • 2023
  • 2022
  • 2021
  • 2020
  • 2019
  • 2018
  • 2017
  • 2016
  • 2015
  • 2014
  • 2013
  • 2012
  • 2011
  • 2010
  • 2009
  • 2008
  • 2007
  • 2006
  • 2005
  • 2004
  • 2003
  • 2002
  • 2001
  • 2000
  • 1999
  • 1998
  • 1997
  • 1996
  • 1995
  • 1994
  • 1993
  • 1992
  • 1991
  • 1990
  • 1989
  • 1988
  • 1987
  • 1986
  • 1985
  • 1984
  • 1983
  • 1982
  • 1981
  • 1980
  • 1979
  • 1978
  • 1977
  • 1976
  • 1975
  • 1974
  • 1973
  • 1972
  • 1971
  • 1970
  • 1969
  • 1968
  • 1967
  • 1966
  • 1965
  • 1964
  • 1963
  • 1958
  • еще
Тематика
Новости
11 июня 2026 г.
Время жизни популяций определяется законами математики
Исследователи НИУ ВШЭ и МГУ доказали универсальный закон, описывающий время исчезновения популяций в случайной среде. Анализ эволюции ветвящихся процессов — сложных вероятностных систем — показал, что вне зависимости от изначального числа особей процесс вымирания подчиняется строгим математическим закономерностям. Результаты опубликованы в Journal of Applied Probability.
8 июня 2026 г.
«За 12 лет на нашем счету почти 1000 операций с пробуждением»
В НИУ ВШЭ прошла XIII Летняя нейролингвистическая школа, организованная Центром языка и мозга при поддержке факультета гуманитарных наук НИУ ВШЭ. В центре внимания слушателей была совместная работа нейролингвистов, нейрохирургов и нейрофизиологов в операционной, стандартизация лингвистических парадигм и практические подходы к сохранению речевой функции пациентов.
5 июня 2026 г.
Аспирантка НИУ ВШЭ открыла «невидимую» планировку античного Париона
Исследовательница из НИУ ВШЭ Идиль Малгиль изучила с помощью дрона с лазерным сканером сверхвысокого разрешения древнеримский город Парион, расположенный на территории современной Турции. Благодаря высокой плотности сканирования удалось зафиксировать крошечные неровности рельефа, скрытые под землей и растительностью. Обнаружены следы целых кварталов, террасных систем и стен, которые невозможно было различить ни при обычных раскопках, ни с помощью аэрофотосъемки. Результаты исследованияо публикованы в международном научном журнале Ancient Civilizations from Scythia to Siberia.

 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!

Публикации
  • Книги
  • Статьи
  • Главы в книгах
  • Препринты
  • Верификация публикаций
  • Расширенный поиск
  • Правила использования материалов
  • Наука в ВШЭ

?

Тематическое моделирование для коротких текстов: сравнительный анализ

Социология: методология, методы, математическое моделирование. 2023. № 56. С. 69–112.
Ващенко В. А.

Устойчивый рост популярности социальных сетей в качестве средства коммуникации актуализирует методологические вопросы, связанные с особенностями обработки коротких текстов, обладающих меньшим семантическим контекстом, чем крупные тексты, широко используемые для обучения и тестирования моделей машинного обучения для работы с текстовыми данными. Тематическое моделирование – метод машинного обучения «без учителя», нацеленный на агрегацию текстов в тематические кластеры – имеет множество академических и практических приложений в случаях отсутствия подробной разметки текстовых данных. Однако, качество работы алгоритмов тематического моделирования может ограничиваться полнотой семантического контекста, необходимого для качественного числового представления единицы текста. В этой статье рассматриваются 3 разных подхода к тематическому моделированию: классический LDА, обогащенный предобученными словарными эмбеддингами, тематическое моделирование на базе трансформерной модели BERT и сетевой подход к задаче тематического моделирования с использованием стохастических блокмоделей. Сравнивается качество работы указанных алгоритмов на наборе русскоязычных комментариев в сети TikTok и проводится формальная оценка скорости и когерентности результирующих тем.

Научное направление: Социология (включая демографию и антропологию) Медиа и коммуникации Компьютерные науки
Язык: русский
DOI
Ключевые слова: анализ текстовых данныхtopic modelingтематическое моделированиеприкладной сетевой анализapplied network analysistextual data analysis
ПУБЛИКАЦИЯ ПОДГОТОВЛЕНА ПО РЕЗУЛЬТАТАМ ПРОЕКТА:
Развитие сетевого анализа в России: адаптация теоретико-методологических подходов и практическое применение (2024)
Похожие публикации
Человек между склонностью к коррупции, ее оправданием или порицанием
Максименко А. А., Дейнека О. С., Крылова Д. В., АНО Центр социальных инициатив, 2026.
Книга представляет собой первое всеобъемлющее исследование феномена коррупции с позиций социальной и экономической психологии с акцентом на изучение механизмов общественного осуждения и личностного порицания. В отличие от традиционных подходов, изучающих восприятие коррупции, отношение к ней или предрасположенность (в том числе склонность) к коррупционному поведению, в работе рассматриваются факторы, определяющие степень морального осуждения и формирования индивидуальных и ...
Добавлено: 13 июня 2026 г.
Сетевой анализ гиперссылок: методологические возможности изучения партнерств в сфере искусственного интеллекта
Бархатова Л. А., Социологические исследования 2026 № 5 С. 71–83
В статье концептуализируются методологические возможности сетевого анализа гиперссылок как способа эмпирической реконструкции социального взаимодействия через цифровые следы. На примере анализа сети партнерств в сфере искусственного интеллекта (ИИ) в России представлена авторская аналитическая схема перевода технических связей гиперссылок в социологические категории. Описан полный цикл обработки данных, собранных веб-краулингом, включая этап контекстуализации через ручную верификацию содержания ссылок. ...
Добавлено: 12 июня 2026 г.
Разработка и валидация опросника для оценки профессиональных компетенций врачей, курирующих беременных с нарушениями углеводного обмена
Алексашина А. О., Русских С. В., Тырановец С. В. и др., Менеджер здравоохранения 2026 № 4 С. 53–60
В связи с ростом распространённости нарушений углеводного обмена у беременных необходим валидированный инструмент для оценки компетенций врачей, участвующих в мультидисциплинарном ведении данной патологии. Цель исследования: комплексная валидация авторской методики (опросника) для оценки профессионального потенциала врачей-эндокринологов, акушеров-гинекологов и терапевтов, курирующих беременных с нарушениями углеводного обмена. Материалы и методы. Проведено методологическое исследование по валидации диагностического инструмента в ...
Добавлено: 11 июня 2026 г.
Форум: Сохранить нельзя разрушить: антропология наследия
Рахманова Л. Я., Белякова Н. А., Бучатская Ю. В. и др., Антропологический форум 2026 Т. 68 С. 11–144
В настоящем «Форуме» обсуждаются разные аспекты критических исследований наследия: современное состояние научного поля, его внутренние и внешние границы, особенности российского контекста, концептуальные и методические вопросы, актуальная и перспективная проблематика. Участники рефлексируют личный опыт существования в поле наследия, включая сочетание вовлеченной / прикладной и исследовательской позиции, указывают на важность различения «эмных» и «этных» категорий и подчеркивают ...
Добавлено: 11 июня 2026 г.
Proceedings of the 6th Workshop on Computational Approaches to Discourse, Context and Document-Level Inferences (CODI 2025)
Strube M., Braud C., Hardmeier C. и др., Suzhou: Association for Computational Linguistics, 2025.
Добавлено: 11 июня 2026 г.
TreeDQN: Sample-efficient off-policy reinforcement learning for combinatorial optimization
Sorokin D., Kostin A., Савченко Л. В. и др., Knowledge-Based Systems 2026 Vol. 348 Article 116258
Добавлено: 10 июня 2026 г.
Microbial diversity and production of milk spirit using traditional Buryat fermentation and distillation technologies
Namsaraev Z., Nanzatov B., Козлова А. Д. и др., Scientific Reports 2026 Vol. 16 No. 1 Article 17769
Дистиллированные кисломолочные напитки встречаются в пищевой промышленности редко, несмотря на повсеместное распространение растительных спиртных напитков. В настоящее время производство крепких дистиллированных алкогольных напитков из кисломолочных продуктов с использованием традиционных технологий известно лишь среди монголоязычных народов и их сибирских соседей. Данное исследование представляет собой первый междисциплинарный анализ дарасуна, традиционного бурятского спиртного напитка, изготавливаемого из кисломолочного напитка ...
Добавлено: 10 июня 2026 г.
Artificial intelligence and digital twins for failure prediction in data center cooling systems: a comprehensive literature review (2018–2026)
Butorova A., Bobakov V., Sergeev A. и др., European Physical Journal: Special Topics 2026 P. 1–19
Добавлено: 10 июня 2026 г.
Ценностная структура и материальный статус семьи как индикаторы и ресурсы устойчивости молодежи в трудной жизненной ситуации
Реан А. А., Шевченко А. О., Ставцев А. А. и др., Социальная психология и общество 2025 Т. 16 № 4 С. 49–70
Контекст и актуальность. Ценности играют значимую роль в процессах социализации и могут выступать психологическим ресурсом в трудных жизненных ситуациях в условиях ограниченного материального благополучия. Теоретической основой послужили модели ценностей Ш. Шварца и Р. Инглхарта, а также концепция экономической социализации. Цель исследования. Определить особенности ценностных ориентаций студентов в зависимости от субъективной оценки материального положения семьи. Гипотеза. Субъективное восприятие материального неблагополучия связано ...
Добавлено: 9 июня 2026 г.
Национальные рейтинги ответственного бизнеса России и Китая: сравнительный анализ и прогноз развития
Кривохижин О. Ю., Вукович Н. А., Смирнова В. А., Стандарты и качество 2026 № 5 С. 105–109
В статье исследуются вопросы, касающиеся национальных рейтингов ответственного бизнеса Китая и России, выделяются их общие черты и существенные различия. В исследовании использовались методы количе ственного и качественного анализа данных национального российского ЭКГ-рейтинга за 2025 г. и китайского рейтинга ответственного бизнеса «Социальный кредит» (CSCS). Резуль таты анализа показали, что РФ и КНР являются лидерами стран БРИКС ...
Добавлено: 9 июня 2026 г.
Innovations in Information and Decision Sciences. Proceedings of the 13th International Conference on Frontiers in Intelligent Computing: Theory and Applications (FICTA 2025), Volume 4
Springer, 2026.
Добавлено: 8 июня 2026 г.
Некоммерческие организации в странах БРИКС: структура сектора и особенности развития
Гаврилов К. В., Заболотский А. В., Карташева А. А. и др., BRICS Expert Council-Russia, 2026.
Это исследование было подготовлено по инициативе Гражданского совета БРИКС с целью системного анализа сектора некоммерческих организаций (НКО) в странах объединения. По состоянию на февраль 2025 года в БРИКС входят десять государств: Бразилия, Египет, Индия, Индонезия, Иран, Китай, ОАЭ, Россия, Эфиопия, ЮАР. В рамках данной работы проведено детальное изучение сектора НКО в каждой из этих стран, что позволило выявить как ...
Добавлено: 5 июня 2026 г.
The non-profit sector in the BRICS countries: current structure and development trends. Executive Summary
Климов И. А., Чепелева М. Д., Гаврилов К. В. и др., Civil BRICS Council, 2026.
Данное исследование было проведено по инициативе Гражданского совета БРИКС с целью проведения системного анализа некоммерческого сектора (далее - "Сектор НКО"), охватывающего как некоммерческие организации (НКО), так и неправительственные организации (НПО), в каждой из стран - участниц БРИКС. С февраля 2025 года в состав БРИКС входят 10 государств-членов: Бразилия, Китай, Египет, Эфиопия, Индия, Индонезия, Иран, Россия, ...
Добавлено: 5 июня 2026 г.
Развитие малых городов России: «низовые» агенты активизации социального потенциала устойчивости
Недосека Е. В., Минина В. Н., Иванов С. А., Экономическая социология 2026 Т. 27 № 1 С. 125–152
Проблематика социально-экономического развития малых городов России уже значительное время находится в фокусе внимания исследователей, занимая не последнее место и в управленческой повестке. Однако использование исключительно управленческих или экономических мер воздействия не приносит ожидаемого результата. При этом и в научной литературе, и в управленческой практике не уделяется должного внимания таким вопросам, как типология хозяйствования и бытования ...
Добавлено: 4 июня 2026 г.
Объективна ли мораль? Классификация методов измерения обыденных метаэтических представлений
Михалёва В. Д., Социология: методология, методы, математическое моделирование 2026 Т. 35 № 1 С. 36–70
Статья посвящена исследованию и систематизации методов измерения обыденных представлений об объективности морали. Актуальность темы обусловлена растущим интересом к изучению того, как обычные люди, не имеющие философской подготовки, воспринимают природу моральных норм и их объективность. На основе анализа существующих подходов к измерению метаэтических представлений, автор показывает разнообразие методологических инструментов, применяемых в современных исследованиях. Показано, что наиболее ...
Добавлено: 4 июня 2026 г.
Подход к автоматическому распознаванию эмоций в транскрипциях речи
Двойникова А. А., Кондратенко К. О., Известия высших учебных заведений. Приборостроение 2023 Т. 66 № 10 С. 818–827
Аннотация. Исследован актуальный в различных областях вопрос распознавания эмоций в транскрипциях речи. Проанализировано влияние методов предобработки (удаление стоп-слов, лемматизация, стемминг) на точность распознавания эмоций в текстовых данных на русском и английском языках. Для проведения экспериментальных исследований использовались орфографические транскрипции диалогов из многомодальных корпусов RAMAS и CMU-MOSEI на русском и английском языке соответственно. Аннотирование этих корпусов ...
Добавлено: 25 апреля 2026 г.
Индекс актуальности темы профессионального выгорания
Завертяева М. А., Найденова Ю. Н., Киреечева А. Д., Социальная психология и общество 2026 Т. 17 № 1 С. 166–182
Контекст и актуальность. Профессиональное выгорание является значимой социальноэкономической проблемой, поэтому существует потребность в его регулярном мониторинге. Традиционно применяемые для измерения выгорания опросники трудозатратны и нерегулярны, что не позволяет использовать их для мониторинга проблемы на макроуровне. По аналогии с индексами на основе медиа в смежных областях настоящая работа рассматривает интенсивность упоминаний выгорания как индикатор общественной релевантности ...
Добавлено: 9 апреля 2026 г.
Эко-реальность и эко-образ российских регионов в пабликах социальной сети «В Контакте»
Немировская А. В., Муничкина О. П., Вестник Института социологии 2026 Т. 17 № 1 С. 183–208
В статье рассматривается медиа-репрезентация экологических проблем в шести российских регионах через призму региональных пабликов в социальной сети «ВКонтакте» с официальным и неофициальным статусом, функционирующих как онлайн-СМИ. На основе анализа контента новостных пабликов в «ВКонтакте» из шести российских регионов, включая как экологически благополучные, так и неблагополучные, рассмотрено, как экологические проблемы освещаются в данных субъектах РФ, и ...
Добавлено: 1 апреля 2026 г.
Эмодукты счастья: коммодификация и маркетинговые стратегии в популярной психологии
Маткин Н. А., Новикова А. А., Экономическая социология 2026 Т. 27 № 1 С. 92–124
На фоне роста спроса на психологические услуги в России и распространения терапевтической культуры цифровые платформы становятся ключевой площадкой для коммерциализации эмоций. Однако механизмы коммодификации эмоций, особенно счастья, на цифровых платформах ещё мало изучены. Данная статья анализирует, как популярные российские психологические блогеры конструируют, упаковывают и продают абстрактную идею «счастья» как стандартизированный рыночный продукт — эмодукт. Исследование ...
Добавлено: 2 февраля 2026 г.
Optimizing Modality Weights in Topic Models of Transactional Data
Хрыльченко К. Я., Воронцов К. В., Automation and Remote Control 2022 Vol. 83 No. 12 P. 1908–1922
Добавлено: 19 ноября 2025 г.
Interaction of Functional Brain Networks Is Associated With k-Clique Percolation in the Human Structural Connectome
Догонашева О. А., Захаров Д. Г., Tiselko V. и др., Human Brain Mapping 2025 Vol. 46 No. 15 Article e70343
Добавлено: 11 ноября 2025 г.
Анализ тематики повседневных разговоров: экспертный подход и автоматические методы
Шерстинова Т. Ю., Вепринцева Д. А., Человек: образ и сущность. Гуманитарные аспекты 2025 № 2(62) С. 89–108
В статье рассматриваются три разных подхода к изучению тематики повседневных разговоров: экспертная тематическая разметка и два автоматических метода (тематическое моделирование и кластеризация). Материалом для исследования послужили расшифровки русской устной повседневной речи из корпуса ОРД, подготовленные на основе звукозаписей спонтанных разговоров, выполненных в естественных коммуникативных ситуациях (дома, на работе, в учебном заведении, в магазине, в поликлинике ...
Добавлено: 3 сентября 2025 г.
Institutional Determinants and Emerging Trends in Foreign Market Entry Strategies by Small and Medium Enterprises: A Systematic Literature Review
Сикачев А. О., Веселова А. С., Управленец 2026 Vol. 17 No. 1 P. 65–83
Когда малые и средние предприятия (МСП) стремятся выйти за пределы своей страны, привлекательность международных рынков не вызывает сомнений. Однако на этом пути часто встречаются многочисленные препятствия, которые могут быть сложными для компаний, не имеющих опыта международной экспансии. Цель данной статьи - восполнить существующий пробел в литературе путем тщательного анализа институциональных факторов, влияющих на интернационализацию МСП, ...
Добавлено: 21 августа 2025 г.
Модификация языковой модели SBERT для выявления ESG-рисков на основе текстовых данных компаний и контрольно-надзорных мероприятий
Бузмаков А. В., Кирпищиков Д. А., Найденова Ю. Н. и др., Вестник Санкт-Петербургского университета. Серия 10. Прикладная математика. Информатика. Процессы управления 2025 Т. 21 № 1 С. 75–91
Разработан подход для выявления рисков, связанных с влиянием компаний на окружающую среду, социальной ответственностью и качеством управления (Environmental, Social and Governance — ESG-рисков), на основе собранной текстовой информации о компании. Для достижения этого предлагается модификация языковой модели SBERT с четко заданной функцией расстояния пространства эмбеддингов. Модель обучена на данных контрольно-надзорных мероприятий и текстов сайтов компаний. ...
Добавлено: 6 июня 2025 г.
  • О ВЫШКЕ
  • Цифры и факты
  • Руководство и структура
  • Устойчивое развитие в НИУ ВШЭ
  • Преподаватели и сотрудники
  • Корпуса и общежития
  • Закупки
  • Обращения граждан в НИУ ВШЭ
  • Фонд целевого капитала
  • Противодействие коррупции
  • Сведения о доходах, расходах, об имуществе и обязательствах имущественного характера
  • Сведения об образовательной организации
  • Людям с ограниченными возможностями здоровья
  • Единая платежная страница
  • Работа в Вышке
  • ОБРАЗОВАНИЕ
  • Лицей
  • Довузовская подготовка
  • Олимпиады
  • Прием в бакалавриат
  • Вышка+
  • Прием в магистратуру
  • Аспирантура
  • Дополнительное образование
  • Центр развития карьеры
  • Бизнес-инкубатор ВШЭ
  • Образовательные партнерства
  • Обратная связь и взаимодействие с получателями услуг
  • НАУКА
  • Научные подразделения
  • Исследовательские проекты
  • Мониторинги
  • Диссертационные советы
  • Защиты диссертаций
  • Академическое развитие
  • Конкурсы и гранты
  • Внешние научно-информационные ресурсы
  • РЕСУРСЫ
  • Библиотека
  • Издательский дом ВШЭ
  • Книжный магазин «БукВышка»
  • Типография
  • Медиацентр
  • Журналы ВШЭ
  • Публикации
  • http://www.minobrnauki.gov.ru/
    Министерство науки и высшего образования РФ
  • https://edu.gov.ru/
    Министерство просвещения РФ
  • http://www.edu.ru
    Федеральный портал «Российское образование»
  • https://elearning.hse.ru/mooc
    Массовые открытые онлайн-курсы
  • НИУ ВШЭ1993–2026
  • Адреса и контакты
  • Условия использования материалов
  • Политика конфиденциальности
  • Правила применения рекомендательных технологий в НИУ ВШЭ
  • Карта сайта
Редактору