• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • A
  • A
  • A
  • A
  • A
Обычная версия сайта
  • RU
  • EN
  • Национальный исследовательский университет «Высшая школа экономики»
  • Публикации ВШЭ
  • Глава
  • Автоматизация использования таксономий для аннотирования текстовых документов.
  • RU
  • EN
Расширенный поиск
Высшая школа экономики
Национальный исследовательский университет
Приоритетные направления
  • бизнес-информатика
  • государственное и муниципальное управление
  • гуманитарные науки
  • инженерные науки
  • компьютерно-математическое
  • математика
  • менеджмент
  • право
  • социология
  • экономика
по году
  • 2027
  • 2026
  • 2025
  • 2024
  • 2023
  • 2022
  • 2021
  • 2020
  • 2019
  • 2018
  • 2017
  • 2016
  • 2015
  • 2014
  • 2013
  • 2012
  • 2011
  • 2010
  • 2009
  • 2008
  • 2007
  • 2006
  • 2005
  • 2004
  • 2003
  • 2002
  • 2001
  • 2000
  • 1999
  • 1998
  • 1997
  • 1996
  • 1995
  • 1994
  • 1993
  • 1992
  • 1991
  • 1990
  • 1989
  • 1988
  • 1987
  • 1986
  • 1985
  • 1984
  • 1983
  • 1982
  • 1981
  • 1980
  • 1979
  • 1978
  • 1977
  • 1976
  • 1975
  • 1974
  • 1973
  • 1972
  • 1971
  • 1970
  • 1969
  • 1968
  • 1967
  • 1966
  • 1965
  • 1964
  • 1963
  • 1958
  • еще
Тематика
Новости
30 апреля 2026 г.
«Моя цель - стать ординарным профессором»
Михаил Саматов занимается теоретическими исследованиями перовскитных солнечных батарей. В интервью проекту «Молодые ученые Вышки» он рассказал о работе на суперкомпьютере Вышки, сотрудничестве с Пекинским университетом и умении делать мебель.
29 апреля 2026 г.
Научить машину читать прошлое: на ФГН создают нейросеть для расшифровки рукописей
Дневники и письма — бесценный источник для гуманитария-исследователя. Но что делать, если текст невозможно прочитать? На факультете гуманитарных наук (ФГН) ВШЭ эту проблему решили перевести на язык математики: команда филологов, историков и специалистов по машинному обучению создала информационную систему, которая не только распознает неразборчивый почерк, но и помогает анализировать содержание архивов.
29 апреля 2026 г.
8 драйверов технологического будущего: что изменит экономику
Какие отрасли определят облик ближайших десятилетий? Премьер-министр  Михаил Мишустин назвал 8 направлений, которые будут развиваться в ближайшие годы. О том, какие образовательные программы НИУ ВШЭ готовят специалистов по этим направлениям — в материале IQ медиа.

 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!

Публикации
  • Книги
  • Статьи
  • Главы в книгах
  • Препринты
  • Верификация публикаций
  • Расширенный поиск
  • Правила использования материалов
  • Наука в ВШЭ

?

Автоматизация использования таксономий для аннотирования текстовых документов.

С. 97–103.
Артемова Е. Л., Чугунова О. Н., Аскарова Ю. А., Насименто С., Миркин Б. Г.

Работа посвящена проблеме автоматического анно- тирования текстового документа ключевыми словами. Обычно, в качестве источника ключевых слов для аннотирования документа используют таксономии. Наш метод состоит из двух этапов, на- званных нами «отображением» и «аннотацией». Процедура ото- бражения соотносит таксономические единицы с рассматривае- мым текстом. Ее результатом является четкое или нечеткое мно- жество таксономических единиц, иначе множество запроса к так- сономии, которое характеризует содержание документа само по себе. На этапе аннотации требуется найти несколько таксономи- ческих единиц на высших уровнях таксономии, покрывающих все или почти все множество запроса. Эту задачу можно решить с помощью процедуры оптимального подъема. Найденные таксо- номические единицы следует считать искомой аннотацией тек- стового документа. Предлагаемый метод можно применять не только к одному текстовому документу, но и к коллекции тексто- вых документов. В таком случае, возникает необходимость в еще одном дополнительном этапе – кластеризации таксономических единиц.

Язык: русский
Полный текст
Ключевые слова: анализ текстованнотация и отображениекластерный анализ

В книге

Анализ изображений, сетей и текстов. Доклады всероссийской научной конференции АИСТ'12. Модели, алгоритмы и инструменты анализа данных; результаты и возможности для анализа изображений, сетей и текстов. Екатеринбург, 16 – 18 марта 2012 года
Анализ изображений, сетей и текстов. Доклады всероссийской научной конференции АИСТ'12. Модели, алгоритмы и инструменты анализа данных; результаты и возможности для анализа изображений, сетей и текстов. Екатеринбург, 16 – 18 марта 2012 года
Вып. 1. , М.: Национальный открытый университет «ИНТУИТ», 2012.
Похожие публикации
Перспективы медиа-мониторинга в исследованиях общественного мнения (на примере доверия президенту)
Анкудинов И. А., Социология: методология, методы, математическое моделирование 2025 № 61 С. 165–203
Изменчивые политические настроения россиян — постоянный предмет интереса социологических фондов. С развитием интернета привычные анкетные исследования стали дополняться онлайн-опросами и, несмотря на некоторый скепсис, «майнингом» социальных сетей. В настоящей статье предпринимается попытка скорректировать стихийную интернет-выборку так, чтобы приблизить ее оценки к репрезентативным омнибусам. Мы используем показатели доверия Президенту РФ в сети и в опросах с ...
Добавлено: 22 апреля 2026 г.
Патриотический дискурс в Рунете: до и после 24 февраля 2022 г.
Анкудинов И. А., Мониторинг общественного мнения: Экономические и социальные перемены 2024 № 2 С. 153–177
Зафиксированный после 24 февраля 2022 г. патриотический подъем нашел своеобразное отражение в русскоязычном сегменте интернета. Хотя социологи почти единодушны в том, что социальное самочувствие граждан и их отношение к властям улучшились, цифровые следы этих изменений не так заметны: невооруженным взглядом видна только усилившаяся поляризация по линии «за — против». В работе измеряется непосредственный (краткосрочный) эффект, ...
Добавлено: 7 сентября 2024 г.
Введение
Полухина Е. В., В кн.: Практики анализа качественных данных в социальных науках.: М.: Издательский дом НИУ ВШЭ, 2023. С. 8–12.
Введение в книгу "Практики анализа качественных данных в социальных науках" (2023) ...
Добавлено: 27 января 2023 г.
Возможности и ограничения цифровых следов и методов машинного обучения в социологии
Богданов М. Б., Смирнов И. Б., Мониторинг общественного мнения: Экономические и социальные перемены 2021 № 1 С. 304–328
В статье описываются возможности и ограничения использования в социологии новых источников данных и методов их сбора, обработки и анализа, а именно — цифровых следов и методов машинного обучения. Сначала обсуждаются недостатки классических источников данных — опросов, а затем, в контексте этих недостатков, на основе релевантных исследований анализируются возможности их преодоления с помощью цифровых следов. В ...
Добавлено: 9 марта 2021 г.
Processing and Analysis of Russian Strategic Planning Programs
Алексейчук Н. Н., Саркисян В. В., Emelyanov A. и др., , in: Digital Transformation and Global Society. Fourth International Conference, DTGS 2019, St. Petersburg, Russia, June 19–21, 2019, Revised Selected Papers.: Springer, 2019. P. 68–81.
Добавлено: 30 октября 2019 г.
Типы родительского участия в учебном процессе детей
Гошин М. Е., Мерцалова Т. А., Груздев И. А., Мониторинг общественного мнения: Экономические и социальные перемены 2019 № 2 С. 282–303
В статье, на основе данных Мониторинга экономики образования, проведенного Институтом образования НИУ ВШЭ в 2016 г., анализируются категории родительского участия в учебном процессе детей. Авторы утверждают, что степень вовлеченности родителей в учебный процесс детей сильно дифференцирована и выделяют пять типов родительского участия: опекуны, фасилитаторы, спонсоры, контролеры и невидимки. Представленные типы вовлеченности неодинаково представлены в семьях ...
Добавлено: 12 июня 2019 г.
Предсказание удовлетворенности постояльцев отелей на основе демографической информации, доступной на момент заселения
Покрышевская Е. Б., В кн.: Третьи чтения памяти профессора Б.Л.Овсиевича "Экономико-математические исследования: математические модели и информационные технологии". Материалы Всероссийской конференции 7-9 ноября 2017 года.: Издательство Нестор-История, 2017. С. 207–210.
Несмотря на активный интерес к анализу интернет-данных в индустрии гостеприимства, до сих пор не было работ, посвященных предиктивной аналитике в упрвлении жалобами клиентов. Мы предлагаем методологию идентификации профилей посетителей, которые, вероятнее всего, могут быть не удовлетворены сервисом отеля и, соответственно, требуют повышенного внимания со стороны сотрудников отеля, а также профилей посетителей, которые, напротив, скорее всего будут ...
Добавлено: 10 апреля 2018 г.
Digital Humanities в истории психологии (на примере фамилии В.М. Бехтерева)
Костригин А. А., Хусяинов Т. М., Цифровой ученый: лаборатория философа 2018 Т. 1 № 1 С. 160–179
В статье обсуждаются проблемы и перспективы использования методологии Digital Humanities в историко-психологических исследованиях. Представлены результаты поиска и анализа упоминаний имени выдающегося психофизиолога, психоневролога и психолога В.М. Бехтерева (1857-1927) в корпусе текстов в системе Google Books на русском и английском языках. Выдвигаются гипотезы относительно высокой или низкой частоты упоминаний. Анализируется распространение идей ученого в различных научных ...
Добавлено: 3 апреля 2018 г.
Texterra: инфраструктура для анализа текстов
Денис Турдаков, Астраханцев Н. А., Недумов Я. Р. и др., Труды Института системного программирования РАН 2014 Т. 26 С. 421–438
В статье описан проект Texterra, в рамках которого была создана инфраструктура для анализа текстов. Texterra предоставляет масштабируемое решение для быстрой обработки текстовых документов, основанное на использовании знаний, извлекаемых из Веб-ресурсов и текстовых документов. В данной статье раскрываются детали реализации проекта, варианты использования и результаты экспериментальных исследований разработанных инструментов. ...
Добавлено: 6 ноября 2017 г.
Социальные медиа: о чем и кому пишут их пользователи? Некоторые подходы к анализу данных
Котырло Е. С., Прикладная эконометрика 2017 № 3 С. 74–99
Изучение поведения социальных групп и отдельных индивидов, сегментация пользователей на основе проявляемых интересов и характера внутрисетевого взаимодействия — это те возможности, которые предоставляют социальные медиа. В статье обобщаются подходы к анализу социальных медиа на базе анализа текстов и анализа социальных сетей, сложившиеся к настоящему времени. Имеющийся инструментарий дополняется использованием показателей концентрации, расширенными возможностями визуализации результатов ...
Добавлено: 20 октября 2017 г.
Проблемы онтолингвистики - 2017: освоение и функционирование языка в ситуации многоязычия: Материалы ежегодной международной научной конференции. 26-28 июня 2017.
Иваново: ЛИСТОС, 2017.
Книга посвящена проблемам становления языка, преимущественно в ситуации билингвизма. ...
Добавлено: 29 июня 2017 г.
Практика оценки эффективности деятельности кластера (на примере Камского инновационного территориально-производственного кластера)
Назарова В. В., Галлямова А. Р., Проблемы теории и практики управления 2016 № 4 С. 49–63
В статье будет произведена оценка данного кластера на основе комплекса методов, включающих в себя оценку конкурентоспособности, как отдельных компаний, так и кластера в целом; далее будут рассчитаны ключевые показатели крупных предприятий-участников; затем будет оценена инновационность кластера, основываясь на оценке инновационности отрасли; также проанализирована степень интеграции кластера с регионом и на последнем этапе приведены итоги оценки ...
Добавлено: 13 февраля 2017 г.
Имя Л.С. Выготского как объект Digital Humanities
Костригин А. А., Хусяинов Т. М., История российской психологии в лицах: Дайджест 2016 № 6 С. 44–66
В статье обсуждаются проблемы и перспективы использования методологии Digital Humanities в историко-психологических исследованиях. Представлены результаты поиска и анализа упоминаний имени Л.С. Выготского в корпусе текстов в системе Google Books на 6 европейских языках (английский, испанский, итальянский, немецкий, русский, французский). Выдвигаются гипотезы относительно высокой или низкой частоты упоминаний. Показаны преимущества и недостатки данного метода качественного и ...
Добавлено: 25 декабря 2016 г.
Speech and Computer 16-th International Conference, SPECOM 2014 LNAI 9773
NY: Springer, 2014.
Добавлено: 19 ноября 2016 г.
Texterra: инфраструктура для анализа текстов.
Денис Турдаков, Недумов Я., Астраханцев Н. и др., Труды Института системного программирования РАН 2014 Т. 26 № 1 С. 421–438
В статье описан проект Texterra, в рамках которого была создана инфраструктура для анализа текстов. Texterra предоставляет масштабируемое решение для быстрой обработки текстовых документов, основанное на использовании знаний, извлекаемых из Веб-ресурсов и текстовых документов. В данной статье раскрываются детали реализации проекта, варианты использования и результаты экспериментальных исследований разработанных инструментов. ...
Добавлено: 13 сентября 2016 г.
Анализ виртуальной обстановки при информационно-психологическом воздействии на социальные группы
Царегородцев А. В., Мухин И. Н., Некраха А. В., Информация и безопасность 2015 Т. 18 № 3 С. 396–399
В статье рассматриваются методы фильтрации информации при информационно-психологическом воздействии на социальные группы через средства массовой коммуникации, в частности рассматриваются задачи методов аттестации текстов, как инструмента противодействия и фильтрации негативной информации. ...
Добавлено: 15 марта 2016 г.
Supplementary Proceedings of the 4th International Conference on Analysis of Images, Social Networks and Texts (AIST'2015)
Aachen: CEUR Workshop Proceedings, 2015.
Добавлено: 9 октября 2015 г.
Supplementary Proceedings of the 3rd International Conference on Analysis of Images, Social Networks and Texts (AIST 2014)
Ekaterinburg: CEUR Workshop Proceedings, 2014.
АИСТ'2014 — Третья Международная Научная Конференция по Анализу Изображений, Сетей и Текстов. УЧАСТНИКИ исследователи, чьи научные интересы связаны с разработкой математических моделей, алгоритмов и инструментов анализа данных; практики, которые в своей повседневной работе сталкиваются с задачами обработки и анализа графических, текстовых, и других структурированных и неструктурированных данных; студенты, интересующихся задачами анализа данных, и желающих расширить свои компетенции в области ...
Добавлено: 28 августа 2014 г.
Fuzzy and rough formal concept analysis: a survey
Пульманс Й., Игнатов Д. И., Кузнецов С. О. и др., International Journal of General Systems 2014 Vol. 43 No. 2 P. 105–134
Добавлено: 9 июня 2014 г.
Знания-Онтологии-Теории: Материалы Всероссийской конференции с международным участием «Знания-Онтологии-Теории» (ЗОНТ-2013)
Новосибирск: Институт математики им. С.Л. Соболева СО РАН, 2013.
В сборнике содержатся тексты докладов, прочитанных на Всероссийской конференции с международным участием «Знания – Онтологии – Теории» (ЗОНТ-2013), которая проходила в г. Новосибирск с 8 по 10 октября 2013 года. Тематика данной конференции отражает основные стадии процессов познания: Обнаружение закономерностей (знаний), скрытых в структурированных и неструктурированных данных. Систематизация знаний. Инженерия знаний. Создание онтологий предметных областей, ...
Добавлено: 10 марта 2014 г.
Меры релевантности строка-текст в проблеме рубрикации научных статей
Артемова Е. Л., Миркин Б. Г., Бизнес-информатика 2014 № 2 С. 51–62
Проблема оценки релеватности строк и текстов возникает в различных задачах, связанных с анализом текстовой информации: информационный поиск и извлечение документов (information retrieval),  вывод гипотез из текста, (textual entailment), категоризация текстов (text categorization), автоматическое реферирование текстов (automatic summarization) и при создании вопросо-ответных систем [question answering].   В этих задачах используются разные модельные и экспериментальные подходы: либо семантические, ...
Добавлено: 24 октября 2013 г.
Анализ структуры бизнес-конфликтов в российских СМИ при помощи поисковых алгоритмов
Градосельская Г. В., В кн.: Современная социология — современной России: Сборник статей VI международной научно-практической конференции памяти А.О. Крыштановского.: М.: Издательский дом НИУ ВШЭ, 2012. С. 609–616.
Информационное пространство постоянно служит источником пополнения базы для исследования различных социальных явлений: в экономике, культурно-религиозной сфере, политике и т.д. Смысловая структура текстов при этом приобретает особое значение. Для исследователя информационного пространства структура текстов может быть полезной в двух направлениях – как способ анализа социальных явлений, так и для сбора информации. Возникает новое направление развития структурного ...
Добавлено: 22 октября 2013 г.
  • О ВЫШКЕ
  • Цифры и факты
  • Руководство и структура
  • Устойчивое развитие в НИУ ВШЭ
  • Преподаватели и сотрудники
  • Корпуса и общежития
  • Закупки
  • Обращения граждан в НИУ ВШЭ
  • Фонд целевого капитала
  • Противодействие коррупции
  • Сведения о доходах, расходах, об имуществе и обязательствах имущественного характера
  • Сведения об образовательной организации
  • Людям с ограниченными возможностями здоровья
  • Единая платежная страница
  • Работа в Вышке
  • ОБРАЗОВАНИЕ
  • Лицей
  • Довузовская подготовка
  • Олимпиады
  • Прием в бакалавриат
  • Вышка+
  • Прием в магистратуру
  • Аспирантура
  • Дополнительное образование
  • Центр развития карьеры
  • Бизнес-инкубатор ВШЭ
  • Образовательные партнерства
  • Обратная связь и взаимодействие с получателями услуг
  • НАУКА
  • Научные подразделения
  • Исследовательские проекты
  • Мониторинги
  • Диссертационные советы
  • Защиты диссертаций
  • Академическое развитие
  • Конкурсы и гранты
  • Внешние научно-информационные ресурсы
  • РЕСУРСЫ
  • Библиотека
  • Издательский дом ВШЭ
  • Книжный магазин «БукВышка»
  • Типография
  • Медиацентр
  • Журналы ВШЭ
  • Публикации
  • http://www.minobrnauki.gov.ru/
    Министерство науки и высшего образования РФ
  • https://edu.gov.ru/
    Министерство просвещения РФ
  • http://www.edu.ru
    Федеральный портал «Российское образование»
  • https://elearning.hse.ru/mooc
    Массовые открытые онлайн-курсы
  • НИУ ВШЭ1993–2026
  • Адреса и контакты
  • Условия использования материалов
  • Политика конфиденциальности
  • Правила применения рекомендательных технологий в НИУ ВШЭ
  • Карта сайта
Редактору