?
Stable Topic Modeling with Local Density Regularization
P. 176-188.
Ключевые слова: стабильностьGibbs samplingtopic modelingLDA stabilityлатентное размещение Дирихлетематическое моделированиеалгоритм сэмплирования Гиббса
ПУБЛИКАЦИЯ ПОДГОТОВЛЕНА ПО РЕЗУЛЬТАТАМ ПРОЕКТА:
В книге
Vol. 9934. , Switzerland : Springer, 2016
Sergey Nikolenko, Sergei Koltcov, Olessia Koltsova, Journal of Information Science 2017 Vol. 43 No. 1 P. 88-102
Добавлено: 7 октября 2016 г.
Нагорный О. С., Мухетдинова А. Т., В кн. : Математическое и компьютерное моделирование [Электронный ресурс]: материалы IV Международной научной конференции (Омск, 11 ноября 2016 г.). : Омск : Издательство Омского государственного университета, 2016. С. 154-156.
В данной работе на материалах раздела о здоровом образе жизни блога lifehacker.ru при помощи тематического моделирования и синтаксического анализа текстов исследуется, как дискурс о биопедагогике проявляет себя в Интернете, какие лингвистические средства для этого используются и какие темы затрагиваются. ...
Добавлено: 25 ноября 2016 г.
Бадрызлова Ю. Г., Nikiforova A., Ляшевская О. Н., , in : Analysis of Images, Social Networks and Texts: 9th International Conference, AIST 2020, Skolkovo, Moscow, Russia, October 15–16, 2020, Revised Selected Papers. Vol. 12602.: Springer, 2021. P. 69-81.
Добавлено: 7 октября 2020 г.
Шерстинова Т. Ю., Кирина М. А., Москвина А. Д., Вестник Томского государственного университета. Филология 2023
В статье затрагивается актуальный вопрос интерпретируемости результатов тематического моделирования, выполненного для литературных текстов. Основной целью исследования стало определение того, насколько полученные тематические распределения (соотношение топик — рассказ) отражают содержательные аспекты художественного текста. Описаны результаты экспериментов по экспертной оценке тематических моделей, построенных на материале русских рассказов первых трех десятилетий XX в. Исследовательский материал составили 3000 текстов ...
Добавлено: 10 декабря 2022 г.
Маслинский К. А., Кольцов С. Н., Кольцова Е. Ю., / Высшая школа экономики. Series SOC "Sociology". 2013. No. 14.
В данном исследовании изучена тематическая структура русскоязычного сектора блог-сервиса <<Живой журнал>> и описаны ее изменения, произошедшие в связи с ростом политической активности после парламентских выборов 2011 года в сравнении с более ранним спокойным периодом (соответственно, 27.11-27.12.2011 и 15.08-15.09.2011). Посты для анализа были автоматически собраны из топ-2000 аккаунтов Живого журнала, согласно его рейтингу по числу друзей, ...
Добавлено: 1 февраля 2013 г.
Шерстинова Т. Ю., Москвина А. Д., Кирина М. А. и др., , in : 2022 31st Conference of Open Innovations Association (FRUCT). Vol. 32.: IEEE, 2022. P. 305-312.
Добавлено: 31 октября 2022 г.
Колмогорова А. В., Terra Linguistica 2023 Т. 14 № 1 С. 7-10
Публикация посвящена анализу современного состояния инженерной лингвистики, ее основных направлений и исследовательских вызовов. Формулируется определение языковых технологий и их типология по критерию решаемых с их помощью задач. Отмечается, что отечественной школе инженерной лингвистики удается сохранить баланс между технологичностью и лингвистичностью изысканий. ...
Добавлено: 31 октября 2023 г.
Кольцов С. Н., Николенко С. И., Кольцова Е. Ю., Письма в Журнал технической физики 2016 Т. 42 № 8 С. 837-839
Предлагается новая вариация метода восстановления плотности распределе- ний вероятностей для задач тематического моделирования. Рассматриваются недостатки алгоритма сэмплирования по Гиббсу и предлагается его модифицированный вариант — гранулированный метод сэмплирования. На основе статистического моделирования показано, что предлагаемый алгоритм является более стабильным по сравнению с двумя другими вариантами алгоритма сэмплирования. ...
Добавлено: 26 июля 2016 г.
Ващенко В. А., Социология: методология, методы, математическое моделирование 2023 № 56 С. 1-20
Устойчивый рост популярности социальных сетей в качестве средства коммуникации актуализирует методологические вопросы, связанные с особенностями обработки коротких текстов, обладающих меньшим семантическим контекстом, чем крупные тексты, широко используемые для обучения и тестирования моделей машинного обучения для работы с текстовыми данными. Тематическое моделирование – метод машинного обучения «без учителя», нацеленный на агрегацию текстов в тематические кластеры – ...
Добавлено: 7 декабря 2023 г.
Милкова М. А., Цифровая экономика 2020 № 3 С. 73-87
Современная экономика все больше вращается вокруг концентрации внимания человека, а значит, принципы управления вниманием являются определяющим звеном функционирования такой экономики. Внимание регулирует взаимодействие людей с миром как на индивидуальном, так и на социальном уровне. Кроме того, привлечение внимания и его последующая перепродажа в настоящее время является массовым бизнесом. Следуя направлению в поведенческой экономике, затрагивающему проблему ...
Добавлено: 29 июня 2023 г.
Кольцов С. Н., Николенко С. И., Кольцова Е. Ю. и др., , in : WebSci 2016 - Proceedings of the 2016 ACM Web Science Conference. : Elsevier, 2016. P. 342-343.
Topic modeling is a powerful tool for analyzing large collections of user-generated web content, but it still suffers from problems with topic stability, which are especially important for social sciences. We evaluate stability for differenttopic models and propose a new model, granulated LDA,that samples short sequences of neighboring words at once. We show that gLDA ...
Добавлено: 24 октября 2016 г.
Воронцов К. В., Потапенко А. А., Машинное обучение и анализ данных 2013 Т. 1 № 6 С. 657-686
Вероятностная тематическая модель (ВТМ) строит интерпретируемое представление коллекции текстовых документов, описывая каждый документ дискретным распределением на множестве тем, каждую тему - дискретным распределением на множестве терминов. Рассматривается обобщённый EM-алгоритм с эвристиками сглаживания, сэмплирования, робастности и разреживания, позволяющий при различных сочетаниях этих эвристик получать как известные тематические модели PLSA, LDA, SWB, так и новые. ...
Добавлено: 19 февраля 2015 г.
Грачев Н. Н., S.N.Safonov, , in : 2018 International Conference on Industrial Engineering, Applications and Manufacturing (ICIEAM). : IEEE, 2018. P. 1-4.
Добавлено: 6 сентября 2019 г.
Vadim Voskresenskiy, Мусабиров И. Л., Александров Д. А., / Высшая школа экономики. Series SOC "Sociology". 2017.
Данная работа изучает онлайн-коммуникацию жителей многоквартирных домов в социальной сети "VK". При помощи алгоритма тематического моделирования LDA, были проанализированы посты, собранные из онлайн-групп, относящихся к многоквартирным домам Санкт-Петербурга. Основной задачей работы было сравнение коммуникации в открытых группах и группах с ограниченным доступом. Также было проанализировано пересечение по участникам между локальными группами и общегородскими движениями. Исследование ...
Добавлено: 20 октября 2017 г.
Зеленков Ю. А., , in : Knowledge Management in Organizations. 14th International Conference, KMO 2019, Zamora, Spain, July 15–18, 2019, Proceedings. Vol. 1027.: Switzerland : Springer, 2019. P. 324-335.
Добавлено: 14 июня 2019 г.
Кольцов С. Н., Кольцова Е. Ю., Николенко С. И., , in : Proceedings of WebSci '14 ACM Web Science Conference, Bloomington, IN, USA — June 23 - 26, 2014. : NY : ACM, 2014. P. 161-165.
Добавлено: 17 октября 2014 г.
Бызов А. А., Социология: методология, методы, математическое моделирование 2019 № 49 С. 131-160
На протяжении практически всей своей истории социологи стремились изучать неструктурированные органические тексты: материалы газет, дневники, мемуары, письма, документы, а с недавнего времени и сообщения, публикации и другие тексты на различных онлайн-платформах. В этой статье обсуждается то, как современные техники интеллектуального анализа текста (ИАТ) могут улучшить классические социологические подходы к анализу такого типа данных. Статья построена ...
Добавлено: 9 декабря 2019 г.
Широканова А. А., Силютина О. Я., , in : Digital Transformation and Global Society Third International Conference, DTGS 2018, St. Petersburg, Russia, May 30 –June 2, 2018, Revised Selected Papers, Part I. Issue 858.: Cham : Springer, 2018. P. 181-194.
Добавлено: 10 октября 2018 г.
Маткин Н. А., Коммуникации. Медиа. Дизайн 2024
В статье предлагается анализ и визуализация российских образов городов, формирующихся в комментариях подписчиков городских сообществ и постов пресс-служб администраций. Образ города рассматривается как фреймовая структура, формирующаяся через политическую и межличностную коммуникацию в сети. Социальная составляющая образа города выделяется как определяющая. В работе апробирована методология изучения образа города в отечественной социальной сети VK. Методология состоит из ...
Добавлено: 15 ноября 2023 г.
Nikita Kaspruk, Olga Silyutina, Карепин В. В., , in : Digital Transformation & Global Society: Second International Conference, DTGS 2017, St. Petersburg, Russia, June 21-23, 2017, Revised Selected Papers. : Springer, 2017. P. 341-346.
Добавлено: 2 декабря 2017 г.
Карпов Н. В., Шадрина Е. В., Алгоритмы, методы и системы обработки данных 2015 № 4(33) С. 33-47
В данной работе предлагается новый способ разработки сервиса обмена знаниями в университетском кластере при помощи поиска компетентных экспертов. Способ основан на современном подходе к поиску экспертов при помощи тематического моделирования. Сервис был реализован в виде системы поддержки принятия решений под названием EXPERTIZE ...
Добавлено: 4 февраля 2016 г.
Бойченко А. Е., Жучкова С. В., Журнал социологии и социальной антропологии 2020 Т. 23 № 2 С. 130-165
Представлены результаты эксплораторного анализа русского рэпа на основе корпуса текстов русскоязычных песен этого жанра. Корпус содержит более 11 000 текстов, собранных авторами посредством автоматического извлечения данных с веб-страниц (веб-скрапинга) и покрывающих более 500 исполнителей, творчество которых приходится на разное время и отличается разной степенью известности. Отталкиваясь от идеи о том, что медиа и музыка могут ...
Добавлено: 12 августа 2020 г.
Ibragimov R. F., Tyurin E. M., Kadilin V. V. и др., Journal of Physics: Conference Series 2016 Vol. 675 P. 042013-042013
Добавлено: 18 октября 2016 г.
Рыков Ю. Г., Нагорный О. С., Кольцова Е. Ю., , in : Digital Transformation & Global Society: Second International Conference, DTGS 2017, St. Petersburg, Russia, June 21-23, 2017, Revised Selected Papers. : Springer, 2017. P. 70-83.
Важная роль цифрового неравенства для препятствования развитию гражданского общества всё более признаётся многими исследователями. Различия в доступности и практике использования сайтов социальных сетей (SNS) можно рассматривать как основные проявления такого цифрового разрыва. В то время как SNS в принципе являются очень удобными пространствами для публичного обсуждения, отсутствие доступа или доминирование текстов повседневной социально-бытовой тематики может ...
Добавлено: 23 октября 2017 г.