• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • A
  • A
  • A
  • A
  • A
Обычная версия сайта
  • RU
  • EN
  • Национальный исследовательский университет «Высшая школа экономики»
  • Публикации ВШЭ
  • Глава
  • Современные методы интеллектуальной работы с текстовыми данными: замена или дополнение традиционному инструментарию социолога?
  • RU
  • EN
Расширенный поиск
Высшая школа экономики
Национальный исследовательский университет
Приоритетные направления
  • бизнес-информатика
  • государственное и муниципальное управление
  • гуманитарные науки
  • инженерные науки
  • компьютерно-математическое
  • математика
  • менеджмент
  • право
  • социология
  • экономика
по году
  • 2027
  • 2026
  • 2025
  • 2024
  • 2023
  • 2022
  • 2021
  • 2020
  • 2019
  • 2018
  • 2017
  • 2016
  • 2015
  • 2014
  • 2013
  • 2012
  • 2011
  • 2010
  • 2009
  • 2008
  • 2007
  • 2006
  • 2005
  • 2004
  • 2003
  • 2002
  • 2001
  • 2000
  • 1999
  • 1998
  • 1997
  • 1996
  • 1995
  • 1994
  • 1993
  • 1992
  • 1991
  • 1990
  • 1989
  • 1988
  • 1987
  • 1986
  • 1985
  • 1984
  • 1983
  • 1982
  • 1981
  • 1980
  • 1979
  • 1978
  • 1977
  • 1976
  • 1975
  • 1974
  • 1973
  • 1972
  • 1971
  • 1970
  • 1969
  • 1968
  • 1967
  • 1966
  • 1965
  • 1964
  • 1963
  • 1958
  • еще
Тематика
Новости
18 мая 2026 г.
В Вышке прошла XXX юбилейная научно-техническая конференция имени Е.В. Арменского
Организатором научного события выступает Московский институт электроники и математики им. А.Н. Тихонова ВШЭ. В этом году главный инженерный студенческий форум проходил 30-й раз и собрал рекордное число участников. Студенты, аспиранты и молодые специалисты из 50 вузов и организаций России представили научно-исследовательские доклады в ИТ-области. Отдельная секция была посвящена научно-исследовательским работам школьников.
15 мая 2026 г.
В НИУ ВШЭ разрабатывают нейросеть для сферы науки и инноваций
Исследователи НИУ ВШЭ учат большие языковые модели понимать русскоязычную научную терминологию, увеличивая при этом их энергоэффективность. Адаптированная модель работает в 2,7 раза быстрее и требует на 73% меньше памяти, чем исходная открытая модель, что позволяет запускать ее на более доступном оборудовании. Программа прошла государственную регистрацию.
15 мая 2026 г.
Стартовал совместный спецпроект бренд-медиа Вышки IQ Media и iFORA ИСИЭЗ
В мае 2026 года стартовал научно-популярный проект «Искусственный интеллект: технологии, данные и будущее», который стал результатом работы двух команд — проекта iFORA Института статистических исследований и экономики знаний НИУ ВШЭ и редакции бренд-медиа IQMedia. Медийно-аналитический спецпроект посвящен современному развитию искусственного интеллекта и аналитике больших данных.

 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!

Публикации
  • Книги
  • Статьи
  • Главы в книгах
  • Препринты
  • Верификация публикаций
  • Расширенный поиск
  • Правила использования материалов
  • Наука в ВШЭ

?

Современные методы интеллектуальной работы с текстовыми данными: замена или дополнение традиционному инструментарию социолога?

Гл. 5.1. С. 310–313.
Александрова М. Ю.

В настоящее время набирает популярность направление интеллектуаль- ного анализа текстовых данных или текст-майнинга. Для социологии развитие мето- дологических подходов к анализу больших объемов неструктурированной текстовой информации (например, Online Big Data) представляет собой актуальное направление, которое может позволить увеличивать объемы анализируемых данных без значитель- ного увеличения времени, необходимого для их обработки, стать источником для полу- чения новых знаний и обнаружения неявных связей, которые могут быть недоступны при ручном анализе. В данной статье рассматриваются основные принципы совре- менного интеллектуального анализа текстовых данных (токенизация, лемматизация, морфологический, синтаксический, семантический анализ и т. д.).

Язык: русский
Полный текст
DOI
Текст на другом сайте
Ключевые слова: интеллектуальный анализтекстовые данныетекст-майнинг

В книге

Будущее социологического знания и вызовы социальных трансформаций (к 90-летию со дня рождения В. А. Ядова). [Электронный ресурс]. Международная научная конференция (Москва, 28–30 ноября 2019 г.). Сборник материалов
ФНИСЦ РАН, 2019.
Похожие публикации
О разработке подхода к автоматизированному сбору и интеллектуальной обработке данных с применением методов веб-скрейпинга и больших языковых моделей (на примере задачи по извлечению оценок уровней готовности технологий)
Грозовский Ф. М., Логинова И. В., Научно-техническая информация. Серия 2: Информационные процессы и системы 2025 № 8 С. 27–36
Предлагается подход к автоматизированному извлечению и структурированию информации из текста, сочетающий веб-скрейпинг для сбора данных из онлайн-источников и большую языковую модель для их последующей интеллектуальной обработки. В качестве объекта исследования выбраны тексты новостных публикаций об уровнях готовности технологий с сайта CNews для апробации разработанной методики в рамках конкретной предметной области. Точность выделения моделью оценок технологической ...
Добавлено: 11 августа 2025 г.
Технология анализа больших данных для выявления организационных связей: возможности системы iFORA
Логинова И. В., Пиекалнитс А. С., Грозовский Ф. М., Социология: методология, методы, математическое моделирование 2025 № 60 С. 36–88
Цель настоящей статьи заключается в демонстрации подходов по анализу связей центров компетенций с использованием системы интеллектуального анализа больших текстово-документных данных iFORA на примере картирования области «Промышленные информационноуправляющие и телекоммуникационные системы». Результаты исследования включают апробацию реализованных в системе iFORA подходов и методов к задачам, которые традиционно решаются в рамках организационного сетевого анализа. Основной результат проведенного анализа ...
Добавлено: 6 августа 2025 г.
Содержательные критерии отнесения утверждений из текстов к категориям «события» и «факторы»
Логинова И. В., Пиекалнитс А. С., Сабидаева Е. А. и др., Искусственный интеллект и принятие решений 2024 № 4 С. 93–110
Цель настоящей работы - совершенствование и автоматизация языковых моделей извлечения из текстовых документов утверждений, связанных с событиями и факторами, с использованием разработанной системы лингвистических маркеров. В статье приведены результаты апробации тексг-майнинговых моделей извлечения событий и факторов на примере аналитического исследования в сфере человеческого потенциала, социальных и гуманитарных наук. Тестирования и оценка качества моделей реализованы на ...
Добавлено: 9 января 2025 г.
Identifying emerging trends and hot topics through intelligent data mining: the case of clinical psychology and psychotherapy
Соколова А. В., Лобанова П. А., Кузьминов И. Ф., Foresight 2024 Vol. 26 No. 1 P. 155–180
Добавлено: 12 октября 2023 г.
Identifying and Visualizing Trends in Science, Technology, and Innovation Using SciBERT
Лобанова П. А., Bakhtin P., Sergienko Y., IEEE Transactions on Engineering Management 2024 No. 71 P. 11898–11906
Добавлено: 8 сентября 2023 г.
СВОБОДНОЕ ИСПОЛЬЗОВАНИЕ ОБЪЕКТОВ АВТОРСКИХ И СМЕЖНЫХ ПРАВ ПРИ ОБРАБОТКЕ БОЛЬШИХ ДАННЫХ (BIG DATA)
Кольздорф М. А., Закон 2021 № 5 С. 142–164
Автором рассматриваются вопросы, связанные с обработкой Больших данных (Big Data), включающих объекты авторских и смежных прав. В частности, раскрыты основные этапы их обработки с применением технологии интеллектуального анализа текстов и данных (text and data mining), приведены примеры использования результатов такой обработки; исследовано, осуществляется ли использование объектов авторских и смежных прав при обработке Больших данных и ...
Добавлено: 9 сентября 2021 г.
ПРЕДСКАЗАНИЕ ЧАСТИЧНОГО НЕОТВЕТА НА ПРИМЕРЕ ДАННЫХ EUROPEAN SOCIAL SURVEY С ИСПОЛЬЗОВАНИЕМ ЛОГИСТИЧЕСКОЙ РЕГРЕССИИ
Александрова М. Ю., В кн.: Социология и общество: традиции и инновации в социальном развитии регионов: Сборник докладов VI Всероссийского социологического конгресса (Тюмень, 14-16 октября 2020 г.).: М.: ФНИСЦ РАН, 2020. С. 4846–4849.
Пропуски в данных представляют собой актуальную проблему в социологических исследованиях. Одним из источников пропусков в данных являются частичные неответы, связанные с нежеланием респондента отвечать на вопрос, затруднением с ответом или другими причинами. Причину возникновения неответов видят как в способе проведения опроса или характеристиках респондентов, так и в характеристиках самой анкеты. В данной работе будет показано, как может прогнозироваться возникновение частичного неответа с помощью логистической регрессии с использованием данных опросов Европейского социального исследования [European Social Survey, ESS]. Были обучены ...
Добавлено: 3 сентября 2021 г.
Методы классификации текстовых данных: можно ли потенциал количественного анализа использовать в качественном исследовании?
Александрова М. Ю., ИНТЕРакция. ИНТЕРвью. ИНТЕРпретация 2021 Т. 13 № 2 С. 81–96
Интеллектуальный анализ текстовых данных, или текст-майнинг, продемонстрировал активное развитие в последние годы. В статье в качестве примера сравниваются методы классификации, пригодные для решения задач по прогнозированию частичных неответов, и на этом материале автор строит рассуждения о том, как может быть реализован анализ текстовых данных в более широком исследовательском поле. Автор рассматривает ряд метрик, адаптированных для ...
Добавлено: 20 августа 2021 г.
Использование текст-майнинга в экономико-географическом отраслевом анализе целлюлозно-бумажной промышленности Европейской России
Кузьминов И. Ф., Лобанова П. А., Региональные исследования 2021 № 1 (71) С. 18–33
Показаны возможности анализа нетрадиционных источников данных для получения более полной и актуальной картины пространственного развития отраслей промышленности. Предложена методика исследования, включающая использование одного из инструментов анализа больших данных, а именно текст-майнинга (text mining), для прикладных экономико-географических исследований, актуальность которой определяется недостаточной полнотой и своевременностью официальных статистических данных, удешевлением соответствующих технологий обработки информации и изобилием источников ...
Добавлено: 4 июня 2021 г.
Методы машинного обучения в социологическом исследовании: предсказание частичного неответа с использованием наивного байесовского классификатора
Александрова М. Ю., Мониторинг общественного мнения: Экономические и социальные перемены 2021 № 1 С. 329–350
Пропущенные данные в социологических исследованиях могут быть связаны с различными причинами, и в данной статье рассматриваются те из них, что появляются в результате незнания, нежелания или затруднения с поиском ответа на отдельные вопросы анкеты у респондента, — частичные неответы (item nonresponse). Остро стоит вопрос о предсказании частичных неответов, решение которого позволило бы сократить вероятность появления пропусков в собираемых данных. В статье показано, как возникновение частичного неответа можно ...
Добавлено: 19 апреля 2021 г.
Big data augmentated business trend identification: the case of mobile commerce
Саритас О., Бахтин П. Д., Кузьминов И. Ф. и др., Scientometrics 2021 Vol. 126 P. 1553–1579
Добавлено: 24 марта 2021 г.
Intangible-driven performance: Two decades searching for the Philosopher's Stone
Шакина Е. А., Молодчик М. А., Паршаков П. А., Russian Management Journal 2020 Vol. 18 No. 3 P. 433–456
The study offers a structural literature review on the twenty years the evolution of the fast-growing research topic of intellectual capital (IC) and intangible-driven performance. Despite a rather short independent history, the IC concept has undergone a substantial transformation, bringing to the discussion vast empirical and methodological literature. Several endeavors carrying out literature review studies ...
Добавлено: 13 января 2021 г.
Автоматическое извлечение текстовых и числовых веб-данных для целей социальных наук
Жучкова С. В., Ротмистров А. Н., Социология: методология, методы, математическое моделирование 2020 № 50-51 С. 141–183
Статья посвящена процедуре автоматического извлечения данных с веб-страниц, т.е. скрапингу веб-данных. Рассмотрены виды веб-данных (цифровые следы и прочие веб-данные числовой, текстовой и других модальностей), возможности их использования (скорость сбора данных и, как следствие, сплошной охват, оперативность и др.) и ограничения (ограниченная репрезентативность, трудности организации хранения большого объема данных, отклонения от традиционной последовательности постановки исследования и ...
Добавлено: 18 июня 2020 г.
Современные технологии обработки естественного языка для решения задач стратегической аналитики
Кузьминов И. Ф., Бахтин П. Д., Тимофеев А. А. и др., Искусственный интеллект и принятие решений 2020 № 1 С. 3–16
Статья посвящена обзору новейших технологий обработки естественного языка (NLP), которые могут быть применены для решения задач стратегической аналитики. Рассмотрены основные проблемы в этой области и конкретные задачи, которые могут быть решены с помощью средств NLP. Приведен обзор основных направлений, в которых задействуются эти средства. Исследованы последние достижения в области NLP и их возможное приложение. Сделаны ...
Добавлено: 6 мая 2020 г.
Advanced text-mining for trend analysis of Russia’s Extractive Industries
Гохберг Л. М., Кузьминов И. Ф., Хабирова Е. Е. и др., Futures 2020 Vol. 115 No. article 102476 P. 1–12
The world economy relies on access to industrial metals, oil and gas for maintaining its critical industrial infrastructure. Although demand is likely to remain high, the most accessible deposits have been depleted. Future capacity growth will be facilitated through further technological developments. Russia as a leading producer is paying great attention to strengthening its competitive ...
Добавлено: 21 октября 2019 г.
The future of food production - a text-mining approach
Бахтин П. Д., Хабирова Е. Е., Кузьминов И. Ф. и др., Technology Analysis & Strategic Management 2020 Vol. 32 No. 5 P. 516–528
The system of food production is facing grand challenges, such as a rising population, climate change, degrading bio-productivity of agricultural land and over-fishing. Agriculture and food production are becoming more innovative and implement new infrastructure, IT-platforms or biotechnologies, like gene editing or synthetic food production. A more advanced knowledge base about food innovations helps customers ...
Добавлено: 16 октября 2019 г.
Информатика, управление и системный анализ: Труды V Всероссийской научной конференции молодых ученых с международным участием.
Ростов н/Д: Ростовский государственный экономический университет "РИНХ", 2018.
В сборнике трудов конференции представлены результаты исследований молодых ученых ведущих научных организаций России по широкому спектру актуальных проблем информатики, управления и системного анализа. Междисциплинарные исследования и интенсивное использование данных - ключевые особенности современной науки. Конференция ИУСА-2018 (Информатика, Управление и Системный Анализ) ставит своей целью наладить устойчивые связи между молодыми учеными, работающими в совершенно разных научных ...
Добавлено: 3 сентября 2019 г.
Исследования структуры научного сообщества на основе семантического анализа: выявление и кластеризация центров компетенций и тематик
Кузьминов И. Ф., Бахтин П. Д., Незнанов А. А. и др., В кн.: Управление научными исследованиями и разработками. Государство и наука: новые модели управления – 2018. Труды Четвертой научно-практической конференции (26 ноября 2018 г., Москва).: ИПУ РАН, 2019. С. 128–137.
Цель данной работы – выработка нового эффективного подхода к выявлению, оценке и анализу центров компетенций, комбинирующего как традиционные методы, основанные на экспертном анализе, библиометрии, патентном анализе и иных подобных инструментах, так и на анализе больших данных, семантическом анализе и текстмайнинге. Актуальность работы связана с тем, что существующие на данный момент подходы и методическая инструментальная база для выявления и анализа ...
Добавлено: 29 августа 2019 г.
Перспективы использования технологий анализа больших данных для стратегической аналитики агропромышленного комплекса
Кузьминов И. Ф., Логинова И. В., Лобанова П. А., Сахарная свекла 2018 № 9 С. 2–7
Стремительно возрастающие объемы разнородной информации актуализируют потребность в обобщении больших массивов данных, необходимых для принятия стратегически верных решений. Агрегировать потоки информации традиционными инструментами становится все сложнее. В связи с этим активно развиваются системы автоматизированного анализа, среди которых инструменты текст-майнинга. Разработанная в ИСИЭЗ НИУ ВШЭ система интеллектуального анализа текстовых данных iFORA – пример такого инструмента. Возможности ...
Добавлено: 29 октября 2018 г.
Stress Scenario Development: Global Challenges for the Russian Agricultural Sector
Кузьминов И. Ф., Логинова И. В., Хабирова Е. Е., / NRU Higher School of Economics. Series WP BRP "Science, Technology and Innovation". 2018. No. 88.
Добавлено: 3 октября 2018 г.
Detecting and Validating Global Technology Trends Using Quantitative and Expert-Based Foresight Techniques
Кузьминов И. Ф., Бахтин П. Д., Хабирова Е. Е. и др., / NRU Higher School of Economics. Series WP BRP "Science, Technology and Innovation". 2018. No. 82.
Добавлено: 3 октября 2018 г.
Technology Classification for the Purposes of Future Studies
Кузьминов И. Ф., Майснер Д., Лавриненко А. С. и др., / NRU Higher School of Economics. Series WP BRP "Science, Technology and Innovation". 2018. No. 78/STI/2018.
Добавлено: 22 января 2018 г.
  • О ВЫШКЕ
  • Цифры и факты
  • Руководство и структура
  • Устойчивое развитие в НИУ ВШЭ
  • Преподаватели и сотрудники
  • Корпуса и общежития
  • Закупки
  • Обращения граждан в НИУ ВШЭ
  • Фонд целевого капитала
  • Противодействие коррупции
  • Сведения о доходах, расходах, об имуществе и обязательствах имущественного характера
  • Сведения об образовательной организации
  • Людям с ограниченными возможностями здоровья
  • Единая платежная страница
  • Работа в Вышке
  • ОБРАЗОВАНИЕ
  • Лицей
  • Довузовская подготовка
  • Олимпиады
  • Прием в бакалавриат
  • Вышка+
  • Прием в магистратуру
  • Аспирантура
  • Дополнительное образование
  • Центр развития карьеры
  • Бизнес-инкубатор ВШЭ
  • Образовательные партнерства
  • Обратная связь и взаимодействие с получателями услуг
  • НАУКА
  • Научные подразделения
  • Исследовательские проекты
  • Мониторинги
  • Диссертационные советы
  • Защиты диссертаций
  • Академическое развитие
  • Конкурсы и гранты
  • Внешние научно-информационные ресурсы
  • РЕСУРСЫ
  • Библиотека
  • Издательский дом ВШЭ
  • Книжный магазин «БукВышка»
  • Типография
  • Медиацентр
  • Журналы ВШЭ
  • Публикации
  • http://www.minobrnauki.gov.ru/
    Министерство науки и высшего образования РФ
  • https://edu.gov.ru/
    Министерство просвещения РФ
  • http://www.edu.ru
    Федеральный портал «Российское образование»
  • https://elearning.hse.ru/mooc
    Массовые открытые онлайн-курсы
  • НИУ ВШЭ1993–2026
  • Адреса и контакты
  • Условия использования материалов
  • Политика конфиденциальности
  • Правила применения рекомендательных технологий в НИУ ВШЭ
  • Карта сайта
Редактору