?
Interval Semi-supervised LDA: Classifying Needles in a Haystack
P. 265–274.
An important text mining problem is to find, in a large collection of texts, documents related to specic topics and then discern further structure among the found texts. This problem is especially important for social sciences, where the purpose is to nd the most representative documents for subsequent qualitative interpretation. To solve this problem, we propose an interval semi-supervised LDA approach, in which certain predened sets of keywords (that dene the topics researchers are interested in) are restricted to specic intervals of topic assignments. We present a case study on a Russian LiveJournal dataset aimed at ethnicity discourse analysis.
ПУБЛИКАЦИЯ ПОДГОТОВЛЕНА ПО РЕЗУЛЬТАТАМ ПРОЕКТА:
В книге
* I: Advances in Artificial Intelligence and Its Applications. , Berlin: Springer, 2013.
Хрыльченко К. Я., Воронцов К. В., Automation and Remote Control 2022 Vol. 83 No. 12 P. 1908–1922
Добавлено: 19 ноября 2025 г.
Сикачев А. О., Веселова А. С., Управленец 2026 Vol. 17 No. 1 P. 65–83
Когда малые и средние предприятия (МСП) стремятся выйти за пределы своей страны, привлекательность международных рынков не вызывает сомнений. Однако на этом пути часто встречаются многочисленные препятствия, которые могут быть сложными для компаний, не имеющих опыта международной экспансии. Цель данной статьи - восполнить существующий пробел в литературе путем тщательного анализа институциональных факторов, влияющих на интернационализацию МСП, ...
Добавлено: 21 августа 2025 г.
I. V. Loginova, A. S. Piekalnits, E. A. Sabidaeva и др., Scientific and Technical Information Processing 2025 Vol. 52 No. 6 P. 738–751
Добавлено: 18 июля 2025 г.
Смирнов Н. М., Higher Education 2026 Vol. 91 No. 3 P. 993–1021
Doctoral education has undergone significant transformations over the past two decades, driven by massification, internationalization, and the diversification of training models. These shifts have led to a growing body of research on doctoral education, yet little is known about the overarching thematic and geographical trends shaping this field. This study applies computational natural language processing ...
Добавлено: 26 мая 2025 г.
Волкова Н. В., Бордунос А. К., Чикер В. А. и др., Социальная психология и общество 2025 Т. 16 № 1 С. 5–27
Цель. Выявить ключевые темы, представленные в современных исследованиях о связи социального капитала с поколенческими различиями в организациях, применяя подходы диджитализации (цифрового моделирования) массива научных публикаций.
Контекст и актуальность. Появление новых технологий, трудовая миграция и включенность представителей различных поколений в производственную деятельность актуализировали процесс непрерывной социализации индивидов в организационную среду и, соответственно, поиск социально-психологических инструментов для ее реализации. Цифровая ...
Добавлено: 5 мая 2025 г.
Егоров В. Ю., Филиппов И. Б., Ахременко А. С., Мониторинг общественного мнения: Экономические и социальные перемены 2025 № 1 С. 214–239
Фокус работы связан с общественным восприятием государственных практик в рамках политики цифровизации. Электронные практики взаимодействия с государством уже давно стали повседневными для большинства россиян: это подтверждается как опросами общественного мнения, так и высоким положением России в мировых рейтингах развития электронного правительства. В этих условиях появилось немало работ, направленных на изучение адаптации человека к новым цифровым ...
Добавлено: 1 мая 2025 г.
Добавлено: 3 апреля 2025 г.
Горшков С. С., Ilyushin E., Chernysheva A. и др., International Journal of Open Information Technologies 2021 Vol. 9 No. 5 P. 12–17
Добавлено: 25 декабря 2024 г.
Колмогорова А. В., Qiuhua S., Вестник Волгоградского государственного университета. Серия 2: Языкознание 2024 Vol. 23 No. 5 P. 60–71
The article is devoted to studying verbalization specifics of various emotional states in the texts in Russian with the purpose to confirm or refute the hypothesis that texts of different emotional classes reflect the denotative situation not identically, which is reflected in thematic specifics and lexical content. The research material consisted of eight corpus texts ...
Добавлено: 29 ноября 2024 г.
Добавлено: 16 февраля 2024 г.
Жучкова С. В., Бойченко А. Е., Смирнов Н. М., Журнал социологии и социальной антропологии 2024 Т. 27 № 1 С. 103–138
В общественной и академической дискуссии рэп зачастую представляется как один из наиболее агрессивных музыкальных жанров, в разном виде изображающий насилие и жестокость. Этому способствует социальный контекст возникновения рэпа — его появление в криминальном районе Нью-Йорка и распространение среди бедного чернокожего населения. Используя понятие гегемонной маскулинности, различные исследователи показывают, как рэперам удается устанавливать доминирование над другими ...
Добавлено: 11 февраля 2024 г.
Колмогорова А. В., Колмогорова П. А., Куликова Е. Р., Вестник Томского государственного университета. Филология 2024 № 89 С. 73–103
В статье анализируются тексты о семи периодах российской истории в трех вузовских учебниках: 1946, 1983 и 2006 годов. С помощью методов компьютерного анализа текстовых данных выявляется специфика поколенческого нарратива об истории страны в указанные три временных периода. Результаты демонстрируют, что тексты разных лет имеют различных эмоциональный «размах», разные тематические доминанты, которые связаны с «духом» соответствующего ...
Добавлено: 10 декабря 2023 г.
Ващенко В. А., Социология: методология, методы, математическое моделирование 2023 № 56 С. 69–112
Устойчивый рост популярности социальных сетей в качестве средства коммуникации актуализирует методологические вопросы, связанные с особенностями обработки коротких текстов, обладающих меньшим семантическим контекстом, чем крупные тексты, широко используемые для обучения и тестирования моделей машинного обучения для работы с текстовыми данными. Тематическое моделирование – метод машинного обучения «без учителя», нацеленный на агрегацию текстов в тематические кластеры – ...
Добавлено: 7 декабря 2023 г.
Маткин Н. А., Коммуникации. Медиа. Дизайн 2025 Т. 10 № 3 С. 89–110
В статье предлагается анализ и визуализация российских образов городов, формирующихся в комментариях подписчиков городских сообществ и постов пресс-служб администраций. Образ города рассматривается как фреймовая структура, формирующаяся через политическую и межличностную коммуникацию в сети. Социальная составляющая образа города выделяется как определяющая. В работе апробирована методология изучения образа города в отечественной социальной сети VK. Методология состоит из ...
Добавлено: 15 ноября 2023 г.
Колмогорова А. В., Залевская Е. Д., Филологический класс 2023 Т. 28 № 2 С. 22–33
Статья посвящена проблеме эвристической продуктивности использования метода компьютерного тематического моделирования для филологического анализа художественного текста. Анализируются результаты применения алгоритма Латентного размещения Дирехле (LDA) для поиска интертекстуальных связей мотивов в двух подкорпусах художественных текстов: 62 текстах разного жанра (рассказы, очерки, повести, критические статьи), принадлежащих перу С. Довлатова, с одной стороны, и 35 художественных произведениях, которые в ...
Добавлено: 31 октября 2023 г.
Колмогорова А. В., Terra Linguistica 2023 Т. 14 № 1 С. 7–10
Публикация посвящена анализу современного состояния инженерной лингвистики, ее основных направлений и исследовательских вызовов. Формулируется определение языковых технологий и их типология по критерию решаемых с их помощью задач. Отмечается, что отечественной школе инженерной лингвистики удается сохранить баланс между технологичностью и лингвистичностью изысканий. ...
Добавлено: 31 октября 2023 г.
Пенская Е. Н., Хачатурян Л. В., Филологические науки. Научные доклады высшей школы 2023 № 5 С. 160–165
Рассмотренысовременные тенденции работыс цифровыми формами рукописного наследия по истории русской литературы второй половины XIX — середины ХХ в. Проанализирован процесс формирования виртуальных архивов как постепенное накопление big data научных исследований — нераспознанного информационного массива растровых документов, содержащего десятки тысяч цифровых форм архивных документов.Предложеныновые подходык классификации растровых изображений рукописных документов для работы в системах интеллектуального анализа, экспериментальные ...
Добавлено: 30 октября 2023 г.
Тихонова М. И., Gavrishchuk A., , in: 2019 International Conference on Engineering and Telecommunication (EnT).: IEEE, 2019. P. 1–5.
Добавлено: 22 сентября 2023 г.