• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • A
  • A
  • A
  • A
  • A
Обычная версия сайта
  • RU
  • EN
  • Национальный исследовательский университет «Высшая школа экономики»
  • Публикации ВШЭ
  • Статьи
  • Сравнение тематических моделей на основе LDA, STM и NMF для качественного анализа русской художественной прозы малой формы
  • RU
  • EN
Расширенный поиск
Высшая школа экономики
Национальный исследовательский университет
Приоритетные направления
  • бизнес-информатика
  • государственное и муниципальное управление
  • гуманитарные науки
  • инженерные науки
  • компьютерно-математическое
  • математика
  • менеджмент
  • право
  • социология
  • экономика
по году
  • 2027
  • 2026
  • 2025
  • 2024
  • 2023
  • 2022
  • 2021
  • 2020
  • 2019
  • 2018
  • 2017
  • 2016
  • 2015
  • 2014
  • 2013
  • 2012
  • 2011
  • 2010
  • 2009
  • 2008
  • 2007
  • 2006
  • 2005
  • 2004
  • 2003
  • 2002
  • 2001
  • 2000
  • 1999
  • 1998
  • 1997
  • 1996
  • 1995
  • 1994
  • 1993
  • 1992
  • 1991
  • 1990
  • 1989
  • 1988
  • 1987
  • 1986
  • 1985
  • 1984
  • 1983
  • 1982
  • 1981
  • 1980
  • 1979
  • 1978
  • 1977
  • 1976
  • 1975
  • 1974
  • 1973
  • 1972
  • 1971
  • 1970
  • 1969
  • 1968
  • 1967
  • 1966
  • 1965
  • 1964
  • 1963
  • 1958
  • еще
Тематика
Новости
21 мая 2026 г.
«Пик глупости» и «долина отчаяния»: экономисты НИУ ВШЭ предложили объяснение эффекта Даннинга - Крюгера
Эффект Даннинга — Крюгера, который описывает резкий всплеск уверенности в своих силах у новичков и такое же стремительное ее падение при наборе опыта, объясняется особенностями процесса обучения и набора новых знаний. К такому выводу пришли сотрудник факультета экономических наук НИУ ВШЭ Андрей Ворчик вместе с независимым исследователем Муратом Мамышевым. Они разработали математическую модель процесса обучения и показали, как формируется и изменяется субъективная уверенность по мере накопления знаний и как  преподаватель может уменьшить «долину отчаяния» для ученика.
20 мая 2026 г.
«Еж» против «родственника»: ученые измерили, как мозг реагирует на неожиданные слова в живой речи
Российские нейрофизиологи с участием исследователей из НИУ ВШЭ показали, что изучать восприятие живой речи можно с помощью вызванных потенциалов. Они доказали, что метод применим не только к отдельным словам, но и к непрерывной речи. Оказалось, что слова, сильно отличающиеся по смыслу от предыдущего контекста, мозг обрабатывает дольше, а служебные слова анализирует в два этапа: сначала определяет их грамматическую роль, а затем на этой основе предсказывает следующее слово. Исследование опубликовано в журнале Frontiers in Human Neuroscience.
20 мая 2026 г.
Творческая работа как лекарство от выгорания
Творческая и доброжелательная атмосфера, новые методы в Международной лаборатории (впоследствии центре) социокультурных исследований привлекают молодых исследователей. За годы работы в Вышке они становятся учеными и преподавателями, известными в России и за рубежом. О своем пути в центре и в Вышке, исследованиях и роли наставников в научных успехах рассказали главный научный сотрудник ЦСКИ Зарина Лепшокова и ведущий научный сотрудник Екатерина Бушина.

 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!

Публикации
  • Книги
  • Статьи
  • Главы в книгах
  • Препринты
  • Верификация публикаций
  • Расширенный поиск
  • Правила использования материалов
  • Наука в ВШЭ

?

Сравнение тематических моделей на основе LDA, STM и NMF для качественного анализа русской художественной прозы малой формы

Вестник Новосибирского государственного университета. Серия: Лингвистика и межкультурная коммуникация. 2022. Т. 20. № 2. С. 93–109.
Кирина М. А.

В статье описываются результаты тематического моделирования малой художественной прозы на основе трех методов – латентного размещения Дирихле (LDA), структурного тематического моделирования (STM) и неотрицательной матричной факторизации (NMF) – в сочетании с разными вариантами предобработки текстов. Апробация экспериментального дизайна осуществляется на материале Корпуса русского рассказа 1900–1930 гг. Исследование позволило выявить особенности рассматриваемых алгоритмов и оценить эффективность их применения для качественного анализа художественной прозы.

Научное направление: Филология и лингвистика
Язык: русский
Полный текст
DOI
Ключевые слова: художественные текстыцифровая гуманитаристикатематическое моделированиеНеотрицательное матричное разложениеавтоматическая обработка текстовлингвистическое моделированиерусский рассказструктурное тематическое моделирование
ПУБЛИКАЦИЯ ПОДГОТОВЛЕНА ПО РЕЗУЛЬТАТАМ ПРОЕКТА:
Методы искусственного интеллекта для филологических исследований (2021)
Похожие публикации
Эстетика аудиовизуальной журналистики. Учебное пособие. 2-е издание
Новикова А. А., Бережная М. А., Кирия И. В., КноРус, 2026.
В учебном пособии очерчена проблемно-тематическая область эстетики журналистики, раскрываются подходы к ее изучению  и представлены эстетические практики как в исторической ретроспективе, так и в актуальном контексте ...
Добавлено: 22 мая 2026 г.
Juxtapositional vs. possessive-like encoding in Russian specificational constructions
Логвинова Н. Н., Russian linguistics 2026 Vol. 50 Article 11
Добавлено: 18 мая 2026 г.
FOCUS ON VOCABULARY Экономика материальных и нематериальных активов: корпусный словарь и ИИ-упражнения по английскому языку
Горина О. Г., Кучеренко С. Н., Камнева Л. Э. и др., St. Petersburg: Asterion, 2026.
Настоящее учебное пособие представляет собой учебно-методический комплекс по ан-глийскому языку для специальных целей (ESP) в сфере экономики материальных и нема-териальных активов. При формировании пособия применены (i) современные методы кор-пусной лингвистики, включая частотный анализ и выявление ключевых слов на основе анализа аутентичных текстов, отражающих актуальные тенденции профессионального дискурса, а также (ii) технологии искусственного интеллекта для автоматизированной ...
Добавлено: 16 мая 2026 г.
КОГНИТИВНО-АССОЦИАТИВНОЕ ПОЛЕ ОНИМОВ САНКТ-ПЕТЕРБУРГА И ВЕНЫ
Зелинская Ю. Ю., Когнитивные исследования языка 2025 № 4(65) С. 180–186
Статья посвящена исследованию онима как когнитивного стимула, способствующего декодированию языка городского пространства двух этносов. Основу исследования составляет анализ результатов ономастического ассоциативного эксперимента, целью которого было выявление доминирующих типов ассоциативных реакций на антропонимы, ойкодонимы, годонимы и ресторонимы Санкт-Петербурга и Вены. Выявленные реакции отображают сформированный ментальный ономастикон респондентов. ...
Добавлено: 16 мая 2026 г.
Лично-числовая асимметрия: согласование пассивных миративов в казымском диалекте хантыйского языка
Старченко А. М., Толдова С. Ю., Типология морфосинтаксических параметров 2023 Т. 6 № 1 С. 130–148
Работа рассматривает ранее не засвидетельствованную модель расщеплённого согласования в парадигме миратива в казымском диалекте хантыйского языка. Расщеплённое согласование выявляется при сравнении активной и пассивной миративных конструкций, а также в ограниченном наборе употреблений нефинитных форм и выражается в том, что в пассивном залоге, в отличие от активного, 3 лицо немаркировано — наблюдается согласование только по числу. ...
Добавлено: 14 мая 2026 г.
Глаголы перемещения веществ в славянских языках
Федоров Д. Г., Jezikoslovni Zapiski 2026 Т. 32 № 1 С. 23–52
В статье описываются глаголы перемещения жидких и сухих веществ в славянских языках. В ходе работы рассматривается, как славянские языки лексикализуют различные ситуации в рамках семантического поля перемещения веществ, и выделяются параметры которые определяют эту лексикализацию (напр., тип вещества, интенсивность и квантованность потока, каузация). Смежные грамматические явления, такие как мена диатезы и лабильность, также играют роль ...
Добавлено: 13 мая 2026 г.
Образ женщины сквозь года: диахронический анализ репрезентации женщин в российской агитационной рекламе
Габриелова Е. В., Максименко О. И., Социальные и гуманитарные науки на Дальнем Востоке 2026 Т. 23 № 1 С. 241–249
В статье представлен диахронический анализ репрезентации женщины в российской рекламе на материале агитационных плакатов 1917 - 1990 годов и социальных и мотивационных рекламных материалов 2000 - 2020 годов. Целью исследования является выявление эволюции вербальных и визуальных стратегий конструирования женского образа в контексте изменений социально-политической и культурной среды, в основу которых легла память поколений. В теоретической ...
Добавлено: 13 мая 2026 г.
Proceedings of the 9th Student Research Workshop associated with the International Conference Recent Advances in Natural Language Processing
Velichkov B., Nikolova-Koleva I., Slavcheva M., Shumen: INCOMA Ltd, 2025.
Добавлено: 12 мая 2026 г.
«Плоский мир» Т. Пратчетта глазами русскоязычного фандома
Кульков А. Н., Цветкова М. В., Вестник Томского государственного университета. Филология 2026 № 100 С. 158–173
Впервые делается попытка рассмотреть особенности фанфикшн как акта продуктивной рецепции, возникшего на основе цикла романов Терри Пратчетта о Плоском мире в России. Проведенный анализ показывает, что прежде всего авторы фанфиков стремятся передать стилистику и комическое начало оригинального цикла Пратчетта, вне зависимости от жанра и формата создаваемых ими произведений. Фикрайтеры наиболее часто обращаются к таким форматам, ...
Добавлено: 10 мая 2026 г.
Вселенная Достоевского
Першкина А. Н., М.: Альпина нон-фикшн, 2026.
Филолог Анастасия Першкина рассказывает о том, как писатель создавал свой мир, кем его населил, какие законы установил и почему этот мир так ярко действует на нас. Кроме того, вы узнаете, кто помогал Федору Михайловичу работать, как писатель связывал между собой произведения, что думали о его текстах современники и что же такое достоевщина. ...
Добавлено: 6 мая 2026 г.
The hypothesis of dependence of the lexical nature of mixed languages on the patterns of their emergence
Гриднева Е. М., Vestnik Tomskogo Gosudarstvennogo Universiteta, Filologiya 2026 No. 100 P. 38–52
Добавлено: 6 мая 2026 г.
Арест писателя Гюнтера Хофе на франкфуртской книжной ярмарке в 1963 г.: конкурирующие образы в медийном пространстве ГДР и ФРГ
Керимов Р. Э., Новое прошлое 2026 № 1 С. 148–162
Арест восточногерманского писателя и директора издательства Гюнтера Хофе на Франкфуртской книжной ярмарке 1963 г. стал уникальным эпизодом идеологической конфронтации между ГДР и ФРГ. Гюнтер Хофе в первую очередь известен своей документально-художественной трилогией про Вторую мировую войну, в которой он принимал активное участие как солдат вермахта. Анализ ареста писателя проводится на основе газетных материалов ГДР и ФРГ, а ...
Добавлено: 5 мая 2026 г.
Эко-реальность и эко-образ российских регионов в пабликах социальной сети «В Контакте»
Немировская А. В., Муничкина О. П., Вестник Института социологии 2026 Т. 17 № 1 С. 183–208
В статье рассматривается медиа-репрезентация экологических проблем в шести российских регионах через призму региональных пабликов в социальной сети «ВКонтакте» с официальным и неофициальным статусом, функционирующих как онлайн-СМИ. На основе анализа контента новостных пабликов в «ВКонтакте» из шести российских регионов, включая как экологически благополучные, так и неблагополучные, рассмотрено, как экологические проблемы освещаются в данных субъектах РФ, и ...
Добавлено: 1 апреля 2026 г.
Грамматический ландшафт художественной прозы: динамика частеречных распределений в русском рассказе XX века
Кирина М. А., В кн.: Русская грамматика: полипарадигмальность как методологический принцип современных научных исследований : материалы IX Международного научного симпозиума.: Издательство ИГУ, 2025. С. 270–275.
В статье представлены результаты пилотного исследования, направленного на описание дистрибуции частей речи в синхронии и диахронии на материале русской прозы малой формы. Рассматриваются изменения морфологического состава художественных текстов (на уровне грамматических классов) на протяжении XX века в соответствии с 9 историко-культурными периодами. Материалом исследования выступает выборка из 943 рассказов суммарным объемом более 3 млн. словоупотреблений. ...
Добавлено: 28 февраля 2026 г.
Эмодукты счастья: коммодификация и маркетинговые стратегии в популярной психологии
Маткин Н. А., Новикова А. А., Экономическая социология 2026 Т. 27 № 1 С. 92–124
На фоне роста спроса на психологические услуги в России и распространения терапевтической культуры цифровые платформы становятся ключевой площадкой для коммерциализации эмоций. Однако механизмы коммодификации эмоций, особенно счастья, на цифровых платформах ещё мало изучены. Данная статья анализирует, как популярные российские психологические блогеры конструируют, упаковывают и продают абстрактную идею «счастья» как стандартизированный рыночный продукт — эмодукт. Исследование ...
Добавлено: 2 февраля 2026 г.
Анализ тематики повседневных разговоров: экспертный подход и автоматические методы
Шерстинова Т. Ю., Вепринцева Д. А., Человек: образ и сущность. Гуманитарные аспекты 2025 № 2(62) С. 89–108
В статье рассматриваются три разных подхода к изучению тематики повседневных разговоров: экспертная тематическая разметка и два автоматических метода (тематическое моделирование и кластеризация). Материалом для исследования послужили расшифровки русской устной повседневной речи из корпуса ОРД, подготовленные на основе звукозаписей спонтанных разговоров, выполненных в естественных коммуникативных ситуациях (дома, на работе, в учебном заведении, в магазине, в поликлинике ...
Добавлено: 3 сентября 2025 г.
Institutional Determinants and Emerging Trends in Foreign Market Entry Strategies by Small and Medium Enterprises: A Systematic Literature Review
Сикачев А. О., Веселова А. С., Управленец 2026 Vol. 17 No. 1 P. 65–83
Когда малые и средние предприятия (МСП) стремятся выйти за пределы своей страны, привлекательность международных рынков не вызывает сомнений. Однако на этом пути часто встречаются многочисленные препятствия, которые могут быть сложными для компаний, не имеющих опыта международной экспансии. Цель данной статьи - восполнить существующий пробел в литературе путем тщательного анализа институциональных факторов, влияющих на интернационализацию МСП, ...
Добавлено: 21 августа 2025 г.
Модификация языковой модели SBERT для выявления ESG-рисков на основе текстовых данных компаний и контрольно-надзорных мероприятий
Бузмаков А. В., Кирпищиков Д. А., Найденова Ю. Н. и др., Вестник Санкт-Петербургского университета. Серия 10. Прикладная математика. Информатика. Процессы управления 2025 Т. 21 № 1 С. 75–91
Разработан подход для выявления рисков, связанных с влиянием компаний на окружающую среду, социальной ответственностью и качеством управления (Environmental, Social and Governance — ESG-рисков), на основе собранной текстовой информации о компании. Для достижения этого предлагается модификация языковой модели SBERT с четко заданной функцией расстояния пространства эмбеддингов. Модель обучена на данных контрольно-надзорных мероприятий и текстов сайтов компаний. ...
Добавлено: 6 июня 2025 г.
Войти через госуслуги? Факторы отношения к сервисам электронного правительства в социальных медиа
Егоров В. Ю., Филиппов И. Б., Ахременко А. С., Мониторинг общественного мнения: Экономические и социальные перемены 2025 № 1 С. 214–239
Фокус работы связан с общественным восприятием государственных практик в рамках политики цифровизации. Электронные практики взаимодействия с государством уже давно стали повседневными для большинства россиян: это подтверждается как опросами общественного мнения, так и высоким положением России в мировых рейтингах развития электронного правительства. В этих условиях появилось немало работ, направленных на изучение адаптации человека к новым цифровым ...
Добавлено: 1 мая 2025 г.
Тематика фельетонов о Новом Поэте и ее диахронические трансформации
Вожик Е. И., Лисюков Р. А., Шаги/Steps 2024 № 3 С. 178–206
В статье описывается тематический репертуар фельетонов о Новом Поэте, публиковавшихся в журнале «Современник» в 1847–1862 гг., и изменения, которые претерпевает их тематика с течением времени. Результаты анализа тематического содержания фельетонов о Новом Поэте демонстрируют, что создатели этой литературной маски (И. И. Панаев и другие авторы), хорошо представляя себе актуальную традицию фельетонного повествования и отправляясь от ...
Добавлено: 3 апреля 2025 г.
The Space of Coordination: Accounting for Multiple Expert Knowledges in Environmental Communication
Antonyuk A., Vera.N.Minina, Pivovarov A. и др., Environmental Communication: A Journal of Nature and Culture 2025 Vol. 19 No. 4 P. 598–615
Активисты, частные компании и некоммерческие организации все чаще обращаются к экологическим проблемам совместно с научными и правительственными организациями, и каждый из них привносит ценный опыт и оригинальные взгляды. Однако растущее разнообразие экспертных знаний в области экологической коммуникации может усложнить разработку и реализацию политики. Чтобы помочь решить эту проблему, мы предлагаем рассматривать экологическую коммуникацию как динамичное ...
Добавлено: 14 января 2025 г.
Через годы, через расстояния…: динамика эмоциональной тональности и ключевых тем в текстах песен о Великой Отечественной войне с 1965 по 1990 годы (на материале корпуса советских песен)
Колмогорова А. В., Колмогорова П. А., Куликова Е. Р., Вестник Томского государственного университета 2024 № 508 С. 65–76
Статья посвящена описанию специфики дискурсивизации темы войны в песнях о Великой Отечественной войне, выпущенных звукозаписывающей компанией «Мелодия» за четыре десятилетия ХХ в.: 60-е, 70-е, 80-е, 90-е годы. Применение методов компьютерной лингвистики позволило получить данные о специфике распределения тем в текстах песен каждого из десятилетий и о ведущей эмоциональной тональности. Выявлено, что, в целом, особенности дискурсивной репрезентации темы войны в ...
Добавлено: 29 ноября 2024 г.
Голос эпохи: лингвостатистические показатели прямой речи в русском рассказе XX века
Кирина М. А., Лукьянчикова А. С., В кн.: Восьмая Калининградская школа по гуманитарной информатике : сборник докладов. Калининград, 12–14 декабря 2024 года [Электронный ресурс]: научное электронное издание.: Калининград: Смартбукс, 2024. С. 69–73.
В статье рассматриваются лингвостатистические показатели прямой речи литературных персонажей в динамике по историческим периодам. Сопоставляются лексические и морфологические особенности прямой речи и устной речи, представленной в Устном корпусе в составе Национального корпуса русского языка. Материалом исследования стала выборка из 648 рассказов, включенных в Корпус русского рассказа XX века. Объем прямой речи составил 529289 словоупотреблений. На ...
Добавлено: 29 ноября 2024 г.
TEXTS OF DIFFERENT EMOTIONAL CLASSES AND THEIR TOPIC MODELING
Колмогорова А. В., Qiuhua S., Вестник Волгоградского государственного университета. Серия 2: Языкознание 2024 Vol. 23 No. 5 P. 60–71
The article is devoted to studying verbalization specifics of various emotional states in the texts in Russian with the purpose to confirm or refute the hypothesis that texts of different emotional classes reflect the denotative situation not identically, which is reflected in thematic specifics and lexical content. The research material consisted of eight corpus texts ...
Добавлено: 29 ноября 2024 г.
  • О ВЫШКЕ
  • Цифры и факты
  • Руководство и структура
  • Устойчивое развитие в НИУ ВШЭ
  • Преподаватели и сотрудники
  • Корпуса и общежития
  • Закупки
  • Обращения граждан в НИУ ВШЭ
  • Фонд целевого капитала
  • Противодействие коррупции
  • Сведения о доходах, расходах, об имуществе и обязательствах имущественного характера
  • Сведения об образовательной организации
  • Людям с ограниченными возможностями здоровья
  • Единая платежная страница
  • Работа в Вышке
  • ОБРАЗОВАНИЕ
  • Лицей
  • Довузовская подготовка
  • Олимпиады
  • Прием в бакалавриат
  • Вышка+
  • Прием в магистратуру
  • Аспирантура
  • Дополнительное образование
  • Центр развития карьеры
  • Бизнес-инкубатор ВШЭ
  • Образовательные партнерства
  • Обратная связь и взаимодействие с получателями услуг
  • НАУКА
  • Научные подразделения
  • Исследовательские проекты
  • Мониторинги
  • Диссертационные советы
  • Защиты диссертаций
  • Академическое развитие
  • Конкурсы и гранты
  • Внешние научно-информационные ресурсы
  • РЕСУРСЫ
  • Библиотека
  • Издательский дом ВШЭ
  • Книжный магазин «БукВышка»
  • Типография
  • Медиацентр
  • Журналы ВШЭ
  • Публикации
  • http://www.minobrnauki.gov.ru/
    Министерство науки и высшего образования РФ
  • https://edu.gov.ru/
    Министерство просвещения РФ
  • http://www.edu.ru
    Федеральный портал «Российское образование»
  • https://elearning.hse.ru/mooc
    Массовые открытые онлайн-курсы
  • НИУ ВШЭ1993–2026
  • Адреса и контакты
  • Условия использования материалов
  • Политика конфиденциальности
  • Правила применения рекомендательных технологий в НИУ ВШЭ
  • Карта сайта
Редактору