Методы машинного обучения в социологическом исследовании: предсказание частичного неответа с использованием наивного байесовского классификатора

М. Ю. Александрова

doi:10.14515/monitoring.2021.1.1756

Публикации

?

Методы машинного обучения в социологическом исследовании: предсказание частичного неответа с использованием наивного байесовского классификатора

Мониторинг общественного мнения: Экономические и социальные перемены. 2021. № 1. С. 329–350.

Александрова М. Ю.

Пропущенные данные в социологических исследованиях могут быть связаны с различными причинами, и в данной статье рассматриваются те из них, что появляются в результате незнания, нежелания или затруднения с поиском ответа на отдельные вопросы анкеты у респондента, — частичные неответы (item nonresponse). Остро стоит вопрос о предсказании частичных неответов, решение которого позволило бы сократить вероятность появления пропусков в собираемых данных.

В статье показано, как возникновение частичного неответа можно прогнозировать с помощью современных методов текст-майнинга и машинного обучения на примере данных Европейского социального исследования (European Social Survey) по Великобритании. Для решения поставленной задачи использовался метод наивного байесовского классификатора (Naive Bayes Classifier) — популярный метод предсказания класса зависимой переменной на основе текстовых данных. С опорой на научную литературу показываем, как работает этот метод. Мы подготовили базу данных, объединяющую полные формулировки вопросов, ответов, инструкций и результатов опросов исследования European Social Survey по Великобритании. Нами показано, как отдельные модели для предсказания появления частичных неответов были обучены с помощью метода наивного байесовского классификатора на основе частот слов и метрики важности слов TF—IDF, процессу расчета которых мы также приводим подробное описание. Каждая из моделей предсказания частичного неответа оценивалась нами с точки зрения частоты возникновения ошибок при получении прогнозов с их помощью. Мы получили списки слов, наличие в вопросах которых статистически чаще сопровождается или не сопровождается частичными неответами. Наши результаты показали, что респонденты менее охотно отвечают на сенситивные вопросы, а некоторые слова, имеющие отношение к процедуре получения ответа на вопрос, статистически чаще пропускаются респондентами.

Научное направление: Социология (включая демографию и антропологию)

Приоритетные направления: социология

Язык: русский

Полный текст

DOI

Текст на другом сайте

Ключевые слова: машинное обучение Европейское социальное исследование European Social Survey ESS machine learning качество измерения текст-майнинг наивный байесовский классификатор item nonresponse text-mining Naive Bayes classifier refusal to answer no answer "Don't know" option measurement quality частичный неответ отказ от ответа отсутствие ответа "затрудняюсь ответить"

Аналитический обзор экспериментальных исследований обыденных моральных суждений о войне

Гаджиев А., Социология: методология, методы, математическое моделирование 2026 Т. 35 № 2 С. 131–163

В статье представлен обзор экспериментальных исследований, сопоставляющих обыденные моральные суждения о войнах с нормативными моделями (международным гуманитарным правом и теорией справедливой войны). На основе анализа работ данного направления, предложена типология исследовательских планов по четырем ключевым параметрам: объект оценки, степень реалистичности сценария, способ предъявления условий и роль нормативных моделей в дизайне. Предложенная типология выступает аналитическим инструментом, ...

Добавлено: 20 июля 2026 г.

«Научная элита» как проблема и понятие

Качанов Ю. Л., Социологический журнал 2026 Т. 32 № 2 С. 59–77

«Научная элита» как эвристический принцип объяснения и аналитическая схема несёт в себе идею значительного превосходства малого количества «выдающихся учёных». В статье вводится понятие пространства науки как многомерного распределения агентов производства научного знания по соотносительным позициям. Это пространство различий выступает как среда, в которой разворачивается научная конкуренция, а также символическое и политическое противоборство за ресурсы и ...

Добавлено: 18 июля 2026 г.

Shared environment, shared mechanisms: comparing pathways to mental health outcomes among indigenous youth and youth with other ethnic backgrounds

Букина А. А., Ерицян К. Ю., Антонова Н. А. и др., Frontiers in Psychology 2026

Добавлено: 15 июля 2026 г.

Отходничество 2020-х гг.: что изменилось за десять лет (на примере Нижегородской области)

Позаненко А. А., Социологические исследования 2026 № 6 С. 64–71

Вследствие сохраняющихся территориальных социально-экономических диспропорций часть жителей российских сел и малых городов уезжают на продолжительный срок на работу без перемены места жительства. Такая внутренняя временная трудовая миграция некоторыми исследователями именуется «отходничеством», а мигранты – «отходниками» – по аналогии с дореволюционной и раннесоветской миграцией крестьян на заработки в город. В начале 2010 х гг. при участии ...

Добавлено: 15 июля 2026 г.

Proceedings of the International Science Conference “APPLIED RESEARCH. GLOBAL SOLUTIONS” (May 6, 2026). Istanbul. Turkey. Part 2.

Scientific publishing house Infinity, 2026.

Добавлено: 12 июля 2026 г.

Социология и социальная антропология: две дисциплины или одна?

Гофман А. Б., Социологическое обозрение 2026 Т. 25 № 2 С. 9–27

Статья посвящена выявлению и уточнению междисциплинарных взаимосвязей, границ и различий между социологией и социальной антропологией, идентификации и самоидентификации каждой из этих наук. Автор подчеркивает близость этих двух дисциплин, значительную подвижность, условность и прозрачность границ между ними, опираясь на ряд примеров из их истории. Многие выдающиеся представители каждой из этих наук относились и сами себя относили, ...

Добавлено: 9 июля 2026 г.

Рождаемость российских поколений 1930-1980-х годов рождения по данным крупнейших национальных опросов женщин и данным статистики текущего учета

Захаров С. В., Андреев Е. М., Демографическое обозрение 2026 Т. 13 № 2 С. 4–36

В статье представлены результаты сравнительного анализа показателей рождаемости российских поколений женщин 1930-1980-х годов рождения, полученных двумя независимыми друг от друга методами: а) основанными на результатах национальных опросов о числе рожденных детей; б) основанными на оценках, получаемых в результате построения специальных когортных таблиц рождаемости с учетом очередности рождения, в которых используются данные текущей регистрации рождений и ежегодные ...

Добавлено: 9 июля 2026 г.

Социальное движение за исторически осведомленное исполнительство музыки: назад в будущее?

Поплавская А. А., Журнал социологии и социальной антропологии 2026 Т. 29 № 2 С. 257–273

В книге «Конец старинной музыки», изданной в издательстве Oxford University Press в 2007 году, гобоист и музыковед Брюс Хейнс поднимает вопросы эволюции музыки, ее сочинения, исполнения и слушания. Представляя весь свой практический и образовательный опыт, он доказывает важность обращения к прошлому. Особое внимание уделяется социальному движению за исторически осведомленное исполнительство (Historically informed performance, HIP), получившему ...

Добавлено: 7 июля 2026 г.

AI Implementation by Small Entrepreneurs in Russia: Flowers Grow also on Stones

Dormidontova Y., Central European Business Review 2026 Vol. 15 No. 2 P. 69–90

Добавлено: 7 июля 2026 г.

Смысл за страницами: какими смыслами обмениваются даритель и получатель при дарении книг

Талакаускас Д. С., Лукин И. Ю., Журнал социологии и социальной антропологии 2026 Т. 29 № 2 С. 144–169

Дарение подарков представляет собой распространенную социальную практику, имеющую длительную историю, и является важной составляющей человеческих взаимоотношений. Однако дарение книг сложно полностью описать с помощью классических теорий дарообмена. Целью исследования выступает определение палитры смыслов, которыми обмениваются даритель и получатель в процесседарообмена книгами. Теоретическая часть исследования основана на интерпретативной парадигме, сама же книга рассматривается как знак, имеющий ...

Добавлено: 7 июля 2026 г.

Долгосрочная трансформация модели рождаемости в России и демографическая политика в 2006–2024 гг

Захаров С. В., AlterEconomics (ранее - Журнал экономической теории) 2026 Т. 23 № 2 С. 429–447

В статье представлены результаты анализа итоговых и структурных характеристик рождаемости для условных и реальных поколений в России в контексте демографической политики, проводимой после 2006 года. Цель исследования— оценить значимость изменений в российской модели рождаемости, произошедших за последние десятилетия, как в отношении общего уровня рождаемости, так и возрастного профиля матерей и числа рожденных ими детей. Использованы ...

Добавлено: 7 июля 2026 г.

Арт-резиденция в России: ролевая диспозиция в (пере)сборке поля современного искусства

Рябков Я. С., Леонтьева А. В., Абрамов Р. Н., Социология власти 2026 Т. 38 № 2 С. 230–261

Исследование посвящено анализу артрезиденций в России как институций, осуществляющих сборку авторов, локального контекста и стейкхолдеров. Основное внимание уделяется трем ключевым аспектам: стратегиям институционального позиционирования в поле искусства и по отношению к стейкхолдерам, практикам резидентов в работе с локальным контекстом и характеру взаимодействия резиденций с местными жителями. Процесс институционализации арт-резиденций реализуется посредством интеграции в «креативную экономику», выстраивания баланса между автономией и интересами стейкхолдеров, а также через нишевую ...

Добавлено: 4 июля 2026 г.

Этика использования искусственного интеллекта в качественных исследованиях

Богданов Т. В., ИНТЕРакция. ИНТЕРвью. ИНТЕРпретация 2026 Т. 18 № 2 С. 30–50

Статья посвящена этическим и методологическим аспектам использования искусственного интеллекта (ИИ) в качественных социологических исследованиях. Широкое применение генеративного ИИ в научных исследованиях запустило междисциплинарную дискуссию об инструментальной эффективности и моральной допустимости применения технологии в процессе получения научного знания. Наиболее активные дебаты происходят в области социальных наук, в частности, среди исследователей, применяющих качественную методологию. Цель статьи — ...

Добавлено: 3 июля 2026 г.

Пережить невиданные ИИ-перемены

Кузьминов Я. И., Кручинская Е. В., Россия в глобальной политике 2026 Т. 24 № 4 С. 92–109

В статье анализируется структурный разрыв между увеличивающейся когнитивной нагрузкой и снижающейся отдачей от неё. Подход, при котором развитие научных и образовательных школ, ориентированных на тренировку суждения, может стать альтернативой количественному наращиванию вычислительных мощностей, которое служит основной стратегией Китая и США. Применительно к России традиция фундаментального образования и сильных исследовательских школ приобретает в новых условиях значение ...

Добавлено: 1 июля 2026 г.

Образ старшего поколения в российском цифровом дискурсе о семье

Соколова Е. Н., Григорьева М. В., Знак: проблемное поле медиаобразования 2026 № 1(59) С. 92–101

Статья анализирует дискурсивные репрезентации образов бабушек и дедушек в пользовательском контенте о семье российского сегмента социальных медиа. На материале корпуса более двух миллионов публичных сообщений за сентябрь 2023 - сентябрь 2024 годов, собранного через Brand Analytics, выделен подкорпус из 82 138 постов с упоминанием старшего поколения. Применены автоматизированное тематическое моделирование (LDA), кластерный анализ, описательная статистика ...

Добавлено: 30 июня 2026 г.

«Штраф за материнство»: влияние возраста рождения первого ребенка на заработную плату женщин

Родина О. А., Прикладная эконометрика 2026 № 2(82) С. 86–104

В статье изучается связь между возрастом рождения первенца и величиной «штрафа за материнство» в заработной плате. Панельная регрессия с фиксированными эффектами построена на данных Российского мониторинга экономического положения и здоровья населения (волны с 2006 по 2022 г.). В результате исследования выявлено, что рождение ребенка приводит к снижению заработной платы на 13.8%. Максимальная разница наблюдается среди ...

Добавлено: 30 июня 2026 г.

Financial literacy and over-indebtedness: Is there a relationship?

Abduramanov A., Кузина О. Е., Daria V. Moiseeva, Russian Journal of Economics 2026 Vol. 12 No. 2 P. 251–273

Добавлено: 30 июня 2026 г.

Сравнение методов автоматической разметки речевых формул в русскоязычном интернет-дискурсе: пилотное исследование

Попова Т. И., Масленикова А. С., В кн.: Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной международной конференции «Диалог». Выпуск 24.Issue 24.: M.: Max press, 2026. С. 420–429.

Настоящее исследование посвящено разработке и сравнению методов автоматической разметки речевых формул в корпусе русскоязычных интернет-комментариев. Речевые формулы представляют собой класс устойчивых неоднословных единиц, выражающих эмоциональную реакцию в диалоге. Материалом исследования послужил корпус из 10 000 комментариев (157 261 токен), собранных из пяти Telegram-каналов. Формальный поиск по словнику из 437 единиц дал точность (precision) 21%. Для ...

Добавлено: 29 июня 2026 г.

Иран и его соседи

Громова А. В., М.: КноРус, 2023.

Учебное пособие по лингвострановедению предназначено для востоковедов, изучающих персидский язык в рамках различных специализаций: регионоведение, филология, история и политология, экономическое развитие стран Ближнего и Среднего Востока. Пособие знакомит с реалиями современной иранской жизни и национальными новостными ресурсами, широко использует материалы Интернета. Книга оставляет известную свободу в выборе материала для занятий в зависимости от уровня владения ...

Добавлено: 29 июня 2026 г.

The Use of the Missing Sample Simulation Modeling to Create a Classification Model for Three or More Classes by the Example of the Carbohydrate Metabolism Disorder Degree Detection Problem

Новиков Р. С., Novopashin M., Позин Б. А., Programming and Computer Software 2026 Vol. 52 No. 1 P. 28 – 38

Добавлено: 26 июня 2026 г.

К ранжированию значимости факторов дестабилизации в странах Азии и Африки методами машинного обучения

Коротаев А. В., Черноморченко И. Ю., Медведев И. А., Восток. Афро-азиатские общества: история и современность 2026 № 3 С. 117–130

В статье методами машинного обучения проранжированы по их значимости факторы крупномасштабной вооруженной и невооруженной дестабилизации в странах Азии и Африки. Показано, что страны Африки в большей мере уязвимы к вооружённой дестабилизации (вплоть до полномасштабных гражданских войн), а страны Азии – к массовой невооружённой (антиправительственные демонстрации, массовые беспорядки, политические забастовки и т. п.). Ключевыми факторами вооружённой ...

Добавлено: 21 июня 2026 г.

Artificial intelligence and digital twins for failure prediction in data center cooling systems: a comprehensive literature review (2018–2026)

Butorova A., Bobakov V., Sergeev A. и др., European Physical Journal: Special Topics 2026 P. 1–19

Добавлено: 10 июня 2026 г.

Влияние шизофрении на лексический уровень языка

Унтила К. В., Тасенко О. А., В кн.: Современная лингвистика: ключ к диалогу. Труды и материалы IV Казанского международного лингвистического саммита.Т. 1: СОВРЕМЕННАЯ ЛИНГВИСТИКА: КЛЮЧ К ДИАЛОГУ.: Каз.: Издательство Казанского университета, 2024. С. 221–224.

Шизофрения – это хроническое психическое расстройство, которое выражается как комбинация психотических симптомов – таких как галлюцинации, бред и дезорганизация когнитивных функций. У многих пациентов с диагнозом шизофрения обнаруживаются нарушения речи. Для исследования были отобраны рассказы об истории из жизни из корпуса 3D. В качестве личных историй были собраны ответы на вопросы «Какой самый лучший или запоминающийся ...

Добавлено: 8 июня 2026 г.

Proceedings of the 43rd International Conference on Machine Learning (ICML 2026)

Seul: PMLR, 2026.

Добавлено: 4 июня 2026 г.