?
Статистический и тематический профиль «Живого журнала»
Цель этого исследования - выработка системы основных статистических показателей, характеризующих русскоязычную блогосферу с точки зрения задач исследований в области социологии, маректинга, лингвистики и ряда других отраслей научного и практического знания, а также изучение основных взаимосвязей между ними. Необходимость сбора такой базовой статистики обусловлена ее отсутствием в публичном доступе – в отличие, например, от социо-демографических показателей населения, без которых не возможны социологические и маркетинговые исследования, или различных словарей русского языка, без которых были бы затруднены исследования в области языкознания. В данном исследовании не ставится задача проверки конкретных гипотез и получения законченных содержательных результатов; вместо этого, исследуются возможности решения различных исследовательских задач с помощью ряда предлагаемых показателей и на основании знаний о связи между ними. Рассматриваются такие показатели, как дата и время поста, длина, тематика и комментируемость поста, строятся временные циклы активности блогеров и их тематические профили. Тематика постов извлекается методами автоматического тематического моделирования, применение которых в сочетании с анализом других данных представляет собой основную новизну работы.