• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • A
  • A
  • A
  • A
  • A
Обычная версия сайта
  • RU
  • EN
  • Национальный исследовательский университет «Высшая школа экономики»
  • Публикации ВШЭ
  • Глава
  • Возможности и ограничения текст-майнинга: применение современных методов анализа текстовых данных
  • RU
  • EN
Расширенный поиск
Высшая школа экономики
Национальный исследовательский университет
Приоритетные направления
  • бизнес-информатика
  • государственное и муниципальное управление
  • гуманитарные науки
  • инженерные науки
  • компьютерно-математическое
  • математика
  • менеджмент
  • право
  • социология
  • экономика
по году
  • 2027
  • 2026
  • 2025
  • 2024
  • 2023
  • 2022
  • 2021
  • 2020
  • 2019
  • 2018
  • 2017
  • 2016
  • 2015
  • 2014
  • 2013
  • 2012
  • 2011
  • 2010
  • 2009
  • 2008
  • 2007
  • 2006
  • 2005
  • 2004
  • 2003
  • 2002
  • 2001
  • 2000
  • 1999
  • 1998
  • 1997
  • 1996
  • 1995
  • 1994
  • 1993
  • 1992
  • 1991
  • 1990
  • 1989
  • 1988
  • 1987
  • 1986
  • 1985
  • 1984
  • 1983
  • 1982
  • 1981
  • 1980
  • 1979
  • 1978
  • 1977
  • 1976
  • 1975
  • 1974
  • 1973
  • 1972
  • 1971
  • 1970
  • 1969
  • 1968
  • 1967
  • 1966
  • 1965
  • 1964
  • 1963
  • 1958
  • еще
Тематика
Новости
2 июня 2026 г.
Человеческий капитал перевешивает социальный: исследование факторов трудовой мобильности в России
Образование и здоровье оказываются важнее связей, блата и знакомств для мобильности российских работников на рынке труда. К такому выводу пришли ученые НИУ ВШЭ, проанализировав данные лонгитюдного обследования домохозяйств «Российский мониторинг экономического положения и здоровья населения НИУ ВШЭ» (РМЭЗ НИУ ВШЭ) за 2016–2019 годы. Главный фактор, который влияет на карьерную мобильность россиян, — получение высшего образования и улучшение самооценки здоровья.
1 июня 2026 г.
Ученые ВШЭ объяснили, как эмоции человека влияют на отношение к цифровому государству
Сегодня взаимодействие человека с государством все чаще происходит через цифровые платформы: порталы госуслуг, электронные сервисы, системы на основе искусственного интеллекта и алгоритмы принятия решений. Однако до сих пор такие технологии в основном рассматривались как технические инструменты, эффективность которых оценивают по скорости работы и удобству интерфейсов. Авторы нового исследования предлагают смотреть на цифровое управление шире — как на эмоциональный опыт, который напрямую влияет на доверие граждан к государству.
28 мая 2026 г.
«Мне нравятся самосбывающиеся пророчества»
Андрей Ворчик изучает счастье, читает научпоп-лекции и хочет, чтобы наука занималась в том числе общественными проблемами. В интервью проекту «Молодые ученые Вышки» он рассказал о том, как эмоции влияют на принятие решений, Бермудском треугольнике из ванной, холодильника и кровати и идеальной формуле образования.

 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!

Публикации
  • Книги
  • Статьи
  • Главы в книгах
  • Препринты
  • Верификация публикаций
  • Расширенный поиск
  • Правила использования материалов
  • Наука в ВШЭ

?

Возможности и ограничения текст-майнинга: применение современных методов анализа текстовых данных

Гл. 11. С. 273–312.
Александрова М. Ю.

Учебное пособие отражает разнообразие способов анализа качественных данных — интервью, наблюдений, фотографий, онлайн-сообщений и проч. Прак- тикующие социальные исследователи рассказывают о принципах работы и лич- ном опыте применения таких методов, как нарративный, тематический, сетевой анализ, дискурс-анализ, обоснованная теория, качественный контент-анализ, текст-майнинг.

Книга состоит из трех взаимосвязанных разделов. В первом разделе читате- лю предлагается разобраться в специфике качественного анализа данных и сори- ентироваться в сложившемся методическом ландшафте. Во втором разделе авто- ры показывают особенности кодирования и обработки данных, демонстрируют специфику работы с различным программным обеспечением — ATLAS.ti, NVivo, Dedoose, Python и проч. В третьем разделе рассказывается о том, в каких форматах можно представить результаты качественного исследования. Каждая глава содер- жит объяснение ключевых понятий и одновременно показывает примеры и воз- можные алгоритмы работы с данными.

Издание адресовано широкому кругу читателей — студентам, исследовате- лям, преподавателям, реализующим проекты и преподающим дисциплины по ме- тодологии и методам социального исследования.

Язык: русский
Полный текст
DOI
Ключевые слова: сегментациялемматизациякорпус документовтокенизацияпредобработка данныхСтемминг

В книге

Практики анализа качественных данных в социальных науках
Практики анализа качественных данных в социальных науках
Александрова М. Ю., Говорова А. Д., Нефедова А. И., Полухина Е. В., Рудь Д. С., Савинская О. Б., Стрельникова А. В., Троцук И. В. М.: Издательский дом НИУ ВШЭ, 2023.
Похожие публикации
Дискриминативная лемматизация сокращений в эпоху LLM
Глазкова А. В., Смаль И. В., Ляшевская О. Н. и др., Доклады Российской академии наук. Математика, информатика, процессы управления (ранее - Доклады Академии Наук. Математика) 2025 Т. 527 С. 146–155
В работе представлено исследование эффективности дискриминативных методов лемматизации сокращений в русскоязычных текстах. В отличие от генеративных подходов, дискриминативные модели осуществляют выбор оптимальной леммы из фиксированного набора вариантов, что исключает риск генерации грамматически некорректных словоформ. Впервые для русского языка проводится комплексный анализ четырех контекстно-ориентированных подходов: (1) ранжирования на основе маскированного языкового моделирования, (2) бинарной классификации, (3) ...
Добавлено: 10 марта 2026 г.
Rubic2: Ensemble Model for Russian Lemmatization
Афанасьев И. А., Glazkova A., Ляшевская О. Н. и др., , in: Proceedings of the 10th Workshop on Slavic Natural Language Processing (Slavic NLP 2025).: Association for Computational Linguistics, 2025. P. 157–170.
Добавлено: 10 марта 2026 г.
Transformer-based approaches for lemmatizing abbreviations in Russian texts
Glazkova A., Ляшевская О. Н., Morozov D. и др., Journal of Mathematical Sciences 2025 Vol. 546 P. 32–47
Добавлено: 10 марта 2026 г.
Определение фолликулярного резерва яичников по данным ультразвукового исследования на основе методов машинного обучения
Мошкин А. С., Лапутин Ф. А., Сидоров И. В., DIGITAL DIAGNOSTICS 2024 Т. 5 № S1 С. 40–42
Обоснование. Овариальный резерв отражает способность женщины к успешной реализации репродуктивной функции. Оценка овариального резерва является актуальной задачей для клинической практики [1] и важна при проведении научных исследований. Использование методов компьютерной обработки диагностических изображений способно ускорить и облегчить выполнение рутинных задач в клинической практике. Их применение при ретроспективном анализе данных в научных целях позволяет повысить объективность ...
Добавлено: 21 февраля 2026 г.
Токенизация недвижимости: новые формы инвестирования и сопутствующие правовые риски
Панарина М. М., Законы России: опыт, анализ, практика 2025 № 10 С. 69–73
В условиях цифровой трансформации гражданско-правовых отношений и цифровизации гражданского оборота последовательно развиваются новые формы владения и управления активами с использованием технологий блокчейн и токенов. При приобретении токенов на недвижимость на специализированных площадках операторов информационных систем («Атомайз», СберБанк, «А-токен») от девелоперов правообладателю такого токена предлагают приобрести «цифровой квадратный метр», «электронный сертификат», «аналог ценной бумаги», «часть квартиры». ...
Добавлено: 6 октября 2025 г.
Невзаимозаменяемые токены (NFT) и токенизация в спорте: сравнительный анализ правового регулирования
Хусаинов Г. Э., Евразийский юридический журнал 2025 № 9 (208) С. 167–171
В настоящей статье проводится комплексный анализ правовых аспектов применения технологий распределённого реестра (блокчейн) и токенизации в сфере физической культуры и спорта. Исследуются ключевые направления внедрения данных технологий, включая эмиссию токенизированных активов, выпуск невзаимозаменяемых токенов (NFT), создание систем лояльности на основе фан-токенов, а также противодействие обороту контрафактной продукции. Центральное место в работе занимает сравнительно-правовой анализ регуляторных ...
Добавлено: 2 октября 2025 г.
Цифровые финансовые активы как объекты имущественных отношений: актуальные вопросы теории и практики
Полежаев О. А., Новоселова Л. А., Власть Закона 2021 С. 75–91
В статье рассмотрены вопросы регулирования отношений, возникающих в сфере цифровых финансовых активов. Авторами освещены основные теоретические и практические недостатки введенного правового регулирования отношений, связанных с оборотом таких активов. Согласно авторской позиции, отечественный законодатель сформировал несколько моделей цифровизации прав, формирующих содержание ценных бумаг, характеризующихся непоследовательностью и противоречивостью. Не разработана последовательная система законодательного регулирования отношений, возникающих в ...
Добавлено: 1 октября 2025 г.
Автоматизированная система проверки файлов, содержащих программный код, на наличие заимствований
Бубнова М. А., Информационные технологии 2025 Т. 31 № 9 С. 496–503
В тексте статьи перечислены результаты разработки системы, нацеленной на обнаружение заимствований в файлах, содержащих коды программ. В автоматизированную систему встроены несколько видов анализа программного кода. Система выступает инструментом поддержки принятия решения для преподавателя университета, так как дает возможность обнаружить работы, в которых присутствует уровень заимствований выше установленного порога. Разработанная система нацелена на проверку работ студентов ...
Добавлено: 11 мая 2025 г.
Disambiguation in context in the Russian National Corpus: 20 yeas later
Ляшевская О. Н., Афанасьев И. А., Stefan Rebrikov и др., , in: Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной международной конференции «Диалог». Вып. 22.Вып. 22.: [б.и.], 2023. P. 307–318.
Добавлено: 15 сентября 2023 г.
Риски и перспективы токенизации творчества
Будник Р. А., Journal of Digital Technologies and Law 2023 Т. 1 № 3 С. 587–611
Цель: токенизация творчества в одном ряду с криптоэкономикой и сетевой инфраструктурой Web3 представляет собой заметный тренд развития современного общества в третьем десятилетии двадцать первого века. Цель настоящей статьи заключается в исследовании рисков и перспектив, возникающих в процессе распоряжения результатами творческого труда в виде невзаимозаменяемых токенов. Методы: методика настоящей работы построена на анализе различных точек зрения ...
Добавлено: 22 августа 2023 г.
Определение засвеченных пикселей на изображении
И.В.Семенков, Е.И. Ершов, Савчик А. В., В кн.: Труды 63-й Всероссийской научной конференции МФТИ. Прикладная математика и информатика.: М.: МФТИ, 2020. С. 216–218.
В случае наличия в фотографируемой сцене слишком ярких объектов, сенсор камеры не всегда может правильно определить цвета, так как ставит в соответствие слишком ярким пикселям максимальное значение, которое сенсор способен зарегистрировать. Принято считать, что засвеченный пиксель - это пиксель у которого хотя бы один из каналов достиг максимального значения. Поэтому часто в научной литературе описание ...
Добавлено: 19 декабря 2022 г.
A hybrid lemmatiser for Old Church Slavonic
Афанасьев И. А., / NRU HSE. Series WP BRP "Linguistics". 2021.
Добавлено: 28 декабря 2021 г.
Оттенки "зеленой" коммуникации в ретейле: экономический анализ учета экотренда
Лебедев А. В., Исраелян Е. А., Маркетинговые коммуникации 2021 № 02(114) С. 124–138
Во время пандемии здоровье стало главной ценностью. Продуктовые ретейлеры осознали преимущества коммуникации с экопотребителями. Авторы выделили сегменты покупателей в зависимости от их отношения к ЗОЖ. В статье приведены данные о половозрастной структуре потребителей с указанием средних значений чеков, описаны портреты различных типов экопотребителей и каналы коммуникации с ними. ...
Добавлено: 10 июня 2021 г.
Spatially intermixed objects of different categories are parsed automatically
Хвостов В. А., Лукашевич А. О., Уточкин И. С., Scientific Reports 2021 No. 11 P. 1–8
Добавлено: 26 января 2021 г.
Блокчейн для науки: революционные возможности, перспективы внедрения, потенциальные проблемы
Космарский А. А., Мониторинг общественного мнения: Экономические и социальные перемены 2019 № 2 С. 388–409
В статье рассматриваются перспективы применения технологии блокчейна (распределенного реестра) в сфере науки. Объясняется, чем ключевые свойства технологии (децентрализация, гарантия неизменности данных, доверие среди не доверяющих друг другу субъектов) могут быть полезны в организации науки. Подробно рассказывается о том, насколько реально работающие проекты в Европе, США и России смогли воплотить в жизнь обещания новой технологии. Описываются ...
Добавлено: 6 января 2021 г.
Стратегические маркетинговые решения
Пантелеева Е. К., В кн.: Маркетинг-менеджмент : учебник и практикум для бакалавриата и магистратуры.: М.: Юрайт, 2018. Гл. 6 С. 117–147.
Перед вами — первый российский учебник по дисциплине «Маркетинг-менеджмент». В нем раскрываются основы маркетинга в XXI в., клиентоориентированность, брендинг и другие темы, знание которых будет полезно как студентам (бакалаврам и магистрам), так и практикующим менеджерам и маркетологам. Вы познакомитесь с особенностями интернет-маркетинга, отношений со стейкхолдерами и создания идей для новых продуктов и услуг. ...
Добавлено: 29 сентября 2020 г.
Подходы к сегментации потребителей экологических продуктов
Никоноров С. М., Лебедев А. В., Аверьянова Л. С., Маркетинг в России и за рубежом 2020 № 1 С. 26–36
Цель данной статьи - это исследование российских потребителей экопродуктов посредством выделения сегментов для повышения эффективности маркетинговых мероприятий. В теоретическом обзоре было изучено 45 российских и зарубежных источников литературы. Эмпирическая часть статьи представлена количественным анализом 280 релевантных респондентов с помощью кластерного анализа, метода ANOVA и построения древ классификации. В результате было получено два статистически значимых сегмента ...
Добавлено: 19 июня 2020 г.
Биржа токенизированных активов для превращения их в рыночный товар
Сенин В. Б., Давыдов В. А., Шмонов М. М., Бизнес. Общество. Власть 2019 № 2 (32) С. 196–211
В статье приведён пример платформы токенизированных активов на финансовом рынке. Рассмотрены области применения токенизированных активов для участников финансового рынка. Описаны правовая база и финансовая модель токенизации кредитного портфеля коммерческого банка. Приведена методика расчета процентной ставки пакета токенов, состоящего из токенов различных кредитов, а также алгоритм расчета размера токена для кредита с заданными параметрами PD и ...
Добавлено: 23 октября 2019 г.
The Rapid Segmentation of Multiple Objects Is Based On Global Rather Than Local Sampling
Хвостов В. А., Уточкин И. С., Стакина Ю. М., Perception 2019 Vol. 48 No. SI P. 126–126
Добавлено: 12 августа 2019 г.
A Reusable Tagset for the Morphologically Rich Language in Change: a Case of Middle Russian
Ляшевская О. Н., , in: Computational Linguistics and Intellectual TechnologiesIssue 18.: M.: Russian State University for the Humanitie, 2019. P. 422–434.
Статья посвящена созданию морфологического стандарта для разметки Старорусского корпуса, который входит в состав исторических корпусов Национального корпуса русского языка (НКРЯ). Для того, чтобы сделать разметку удобной для лингвистов, работающих с историческими и современными корпусами, а также для разработчиков систем автоматической обработки исторических текстов, мы предусматриваем две параллельные схемы морфологической разметки, в нотации НКРЯ и Универсальных зависимостей ...
Добавлено: 12 июня 2019 г.
Continuous to discrete: Ensemble-based segmentation in the perception of multiple feature conjunctions
Уточкин И. С., Хвостов В. А., Стакина Ю. М., Cognition 2018 Vol. 179 P. 178–191
Добавлено: 25 июня 2018 г.
  • О ВЫШКЕ
  • Цифры и факты
  • Руководство и структура
  • Устойчивое развитие в НИУ ВШЭ
  • Преподаватели и сотрудники
  • Корпуса и общежития
  • Закупки
  • Обращения граждан в НИУ ВШЭ
  • Фонд целевого капитала
  • Противодействие коррупции
  • Сведения о доходах, расходах, об имуществе и обязательствах имущественного характера
  • Сведения об образовательной организации
  • Людям с ограниченными возможностями здоровья
  • Единая платежная страница
  • Работа в Вышке
  • ОБРАЗОВАНИЕ
  • Лицей
  • Довузовская подготовка
  • Олимпиады
  • Прием в бакалавриат
  • Вышка+
  • Прием в магистратуру
  • Аспирантура
  • Дополнительное образование
  • Центр развития карьеры
  • Бизнес-инкубатор ВШЭ
  • Образовательные партнерства
  • Обратная связь и взаимодействие с получателями услуг
  • НАУКА
  • Научные подразделения
  • Исследовательские проекты
  • Мониторинги
  • Диссертационные советы
  • Защиты диссертаций
  • Академическое развитие
  • Конкурсы и гранты
  • Внешние научно-информационные ресурсы
  • РЕСУРСЫ
  • Библиотека
  • Издательский дом ВШЭ
  • Книжный магазин «БукВышка»
  • Типография
  • Медиацентр
  • Журналы ВШЭ
  • Публикации
  • http://www.minobrnauki.gov.ru/
    Министерство науки и высшего образования РФ
  • https://edu.gov.ru/
    Министерство просвещения РФ
  • http://www.edu.ru
    Федеральный портал «Российское образование»
  • https://elearning.hse.ru/mooc
    Массовые открытые онлайн-курсы
  • НИУ ВШЭ1993–2026
  • Адреса и контакты
  • Условия использования материалов
  • Политика конфиденциальности
  • Правила применения рекомендательных технологий в НИУ ВШЭ
  • Карта сайта
Редактору