• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • A
  • A
  • A
  • A
  • A
Обычная версия сайта
  • RU
  • EN
  • Национальный исследовательский университет «Высшая школа экономики»
  • Публикации ВШЭ
  • Статьи
  • Проблема идентификации именованных сущностей при их автоматическом извлечении
  • RU
  • EN
Расширенный поиск
Высшая школа экономики
Национальный исследовательский университет
Приоритетные направления
  • бизнес-информатика
  • государственное и муниципальное управление
  • гуманитарные науки
  • инженерные науки
  • компьютерно-математическое
  • математика
  • менеджмент
  • право
  • социология
  • экономика
по году
  • 2027
  • 2026
  • 2025
  • 2024
  • 2023
  • 2022
  • 2021
  • 2020
  • 2019
  • 2018
  • 2017
  • 2016
  • 2015
  • 2014
  • 2013
  • 2012
  • 2011
  • 2010
  • 2009
  • 2008
  • 2007
  • 2006
  • 2005
  • 2004
  • 2003
  • 2002
  • 2001
  • 2000
  • 1999
  • 1998
  • 1997
  • 1996
  • 1995
  • 1994
  • 1993
  • 1992
  • 1991
  • 1990
  • 1989
  • 1988
  • 1987
  • 1986
  • 1985
  • 1984
  • 1983
  • 1982
  • 1981
  • 1980
  • 1979
  • 1978
  • 1977
  • 1976
  • 1975
  • 1974
  • 1973
  • 1972
  • 1971
  • 1970
  • 1969
  • 1968
  • 1967
  • 1966
  • 1965
  • 1964
  • 1963
  • 1958
  • еще
Тематика
Новости
26 мая 2026 г.
Гибкость рынка труда как новая норма: ее формы и адаптация работников
Гибкий рынок труда, который наблюдается сегодня, — не временная тактика или вынужденная мера, а системный ответ на ряд вызовов. Как меняется карьера, какие формы гибкости встречаются и как работникам адаптироваться к ним, в колонке для IQ Медиа размышляет директор Института занятости и профессий НИУ ВШЭ Федор Прокопов.
25 мая 2026 г.
Биологи ВШЭ получили «молекулярный отпечаток» преэклампсии
Исследователи НИУ ВШЭ использовали новый способ моделирования состояния гипоксии в клетках плаценты при беременности, осложненной преэклампсией, и обнаружили молекулярные маркеры кислородного голодания тканей. Гипоксия — один из ключевых механизмов преэклампсии, полученные результаты важны для более точной и своевременной диагностики заболевания, а также для разработки эффективных методов лечения. Работа опубликована в журнале Placenta.
22 мая 2026 г.
Лаборатория живых смыслов: как проект НИУ ВШЭ и СахГУ переосмысляет труд
Проект «Зеркальные лаборатории» НИУ ВШЭ — Пермь и Сахалинского государственного университета (СахГУ) изучает, как культура, среда и технологии формируют и меняют трудовые смыслы. Исследование объединяет индивидуальный опыт, профессиональные нормы, городские проблемы, творческие практики и цифровые условия труда. Руководитель Лаборатории междисциплинарных исследований по антропологии труда НИУ ВШЭ в Перми Лилия Пантелеева рассказала о работе проекта.

 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!

Публикации
  • Книги
  • Статьи
  • Главы в книгах
  • Препринты
  • Верификация публикаций
  • Расширенный поиск
  • Правила использования материалов
  • Наука в ВШЭ

?

Проблема идентификации именованных сущностей при их автоматическом извлечении

Актуальные инновационные исследования: наука и практика. 2013. № 1.
Толдова С. Ю., Брыкина М. М., Файнвейц А. В.

Настоящая статья посвящена базовым параметрам системы извлечения из текста именованных сущностей, основанной на словарях. Компонент извлечения именованных сущностей используется во многих приложениях, в частности, весьма перспективным направлением является пополнение данных семантического веба (например, LOD-онтологий) информацией из неструктурированных источников (текстов). Основным объектом нашего внимания являются методы разрешения различной омонимии для именованных сущностей, основанные на словарях и регулируемые эвристическими правилами. Такого рода система позволяет, во-первых, обеспечить достаточно высокую точность выделения объектов. Во-вторых, она дает возможность пользователю-неспециалисту модифицировать и обновлять предметную область. В-третьих, вновь вводимые объекты также могут выделяться с высокой точностью. В статье представлена общая структура словарей, а также специфические для различных классов свойства синонимов, контекстных слов, выражений и объектов, которые могут обеспечить разрешение омонимии.

Язык: русский
Полный текст
Текст на другом сайте
Ключевые слова: извлечение информации из текстовименованные сущностионтологическая омонимиянеструктурированные источники
Похожие публикации
В генеральских руках Ерофея: О синтаксическом представлении именованных сущностей в поэтическом и исторических корпусах
Ляшевская О. Н., Журавлева А. А., В кн.: VII Международные Бодуэновские чтения: Международная конференция И.А. Бодуэн де Куртенэ и мировая лингвистика.: Каз.: Казанский (Приволжский) федеральный университет, 2019.
В статье анализируется смешанная адъективно-генитивная посессивная конструкция в контексте ее представления в синтаксическом формализме Universal Dependencies. Исследование выполнено на материалах частотных синтаксических баз данных поэтического и старорусского корпусов НКРЯ. ...
Добавлено: 15 декабря 2019 г.
Алгоритм автоматического выделения жалоб пациентов из историй болезни
Грибова В. В., Шахгельдян К. И., Шалфеева Е. А. и др., В кн.: Новые информационные технологии в автоматизированных системах: материалы двадцать второго научно-технического семинара.: М.: Институт прикладной математики им. М.В. Келдыша РАН, 2019. С. 204–209.
В настоящее время медицинские организации накапливают большой объем неструктурированной информации о пациентах, для обработки которой требуются алгоритмы формализации текста. Примером такой задачи является автоматическое извлечение жалоб пациентов и их характеристик из текстов историй болезни. В данной работе предлагается алгоритм, использующий синтаксический анализ текста истории болезни, с дальнейшим уточнением семантики при помощи онтологии, содержащей описание жалоб ...
Добавлено: 30 апреля 2019 г.
СЕМАНТИЧЕСКАЯ ОБРАБОТКА НЕСТРУКТУРИРОВАННЫХ ТЕКСТОВЫХ ДАННЫХ НА ОСНОВЕ ЛИНГВИСТИЧЕСКОГО ПРОЦЕССОРА PULLENTI
Козеренко Е. Б., Кузнецов К. И., Романов Д. А., Информатика и ее применения 2018 Т. 12 № 3 С. 91–98
Представлена методика создания систем извлечения знаний, основанная на подходе, главным инструментом которого является программный пакет PullEnti, включающий алгоритмы морфологического и семантико-синтаксического анализа для выделения сущностей определенных типов из текстов естественного языка (персоны, организации, локации и другие целевые семантические объекты). В системе PullEnti используются динамически подключаемые компоненты (плагины), что позволяет без перекомпилирования активировать различные функциональные возможности. ...
Добавлено: 19 декабря 2018 г.
Инструментальная система на базе языка шаблонов LSPL: новые средства и приложения
Большакова Е. И., Иванов К. М., Тодуа А. Р., В кн.: Ломоносовские чтения: научная конференция, Москва, факультет ВМК МГУ имени М.В. Ломоносова, 17-26 апреля 2017 г.: Тезисы докладов.: М.: МГУ, МАКС Пресс, 2017. С. 123–124.
Рассматриваются новые инструментальные средства, разработанные в рамках системы извлечения информации из русскоязычных текстов по лексико-синтаксическим шаблонам, а также созданные на их базе прикладные системы. ...
Добавлено: 5 сентября 2017 г.
Система для извлечения информации из текстов на базе лексико-синтаксических шаблонов
Большакова Е. И., Иванов К. М., Сапин А. С. и др., В кн.: Пятнадцатая национальная конференция по искусственному интеллекту с международным участием КИИ-2016 (3-7 октября 2016г., г.Смоленск, Россия): Труды конференцииТ. 1.: Смоленск: Универсум, 2016. С. 14–22.
Описывается текущее состояние программной системы с открытым кодом, разработанной и применяемой для построения различных приложений по извлечению информации из текстов на русском языке. Извлекаемая информация специфицируется в виде лексико-синтаксических шаблонов и правил языка LSPL. ...
Добавлено: 5 сентября 2017 г.
Система ALEX как средство для многоцелевой автоматизированной обработки текстов
Соколова Е. Г., Жигалов В., Кононенко И. С. и др., В кн.: Компьютерная лингвистика и интеллектуальные технологии. Труды международного семинара "Диалог'2002"Т. 2.: М.: ГУП Академический научно-издательский, производственно-полиграфический и книгораспространительский центр РАН "Издательство "Наука", 2002.
В статье представлена программе многоцелевой автоматизированной обработки текстов Alex . Основой системы является технология иерархических шаблонов, Средствами системы Alex разработан словарь и набор лексических шаблонов,  позволяющий структурировать исходную информацию. ...
Добавлено: 7 апреля 2014 г.
Dictionary-based ambiguity resolution in Russian named-entities recognition. A case study
Brykina M. M., Толдова С. Ю., Faynveyts A. V., , in: Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной Международной конференции «Диалог» (Бекасово, 29 мая - 2 июня 2013 г.). В 2-х т.Т. 1: Основная программа конференции. Вып. 12 (19).: М.: РГГУ, 2013. P. 163–177.
The Information Extraction task and the task of Named Entities recognition (NER) in unstructured texts in particular, are essential for modern Mass Media systems. The paper presents a case study of NER system for Russian. The system was built and tested on the Russian news texts. The method of ambiguity resolution under discussion is based ...
Добавлено: 13 февраля 2014 г.
Современные проблемы и тенденции компьютерной лингвистики
Толдова С. Ю., Ляшевская О. Н., Вопросы языкознания 2014 № 1 С. 120–145
Статья посвящена обзору современных тематик и актуальных направлений компьютерной лингвистики на основе анализа материалов одной из конференции в этой области, а именно, 24-ой Международная конференция по компьютерной лингвистике Coling2012.  В ней приводится анализ основных подходов и проблемных точек в таких традиционных областях автоматической обработки текста, как автоматический морфологический и синтаксический анализ, машинный перевод и др. ...
Добавлено: 15 октября 2013 г.
Новые технологические тренды: выявление в текстах на базе использования гибридных моделей и анализа временных рядов паттернов данных
Хорошевский В. Ф., Информационно-измерительные и управляющие системы 2013 Т. 11 № 5 С. 25–34
В настоящей работе обсуждаются вопросы автоматизации процессов выявления новых технологических трендов по текстовым коллекциям на основе гибридного подхода, ориентированного на интеграцию классических статистических методов и методов извлечения информации из текстов на основе системы индикаторов выявления объектов, характеризующих технологические тренды. Спецификой предлагаемого подхода является и то, что по результатам статистической обработки коллекций документов происходит формирование временных ...
Добавлено: 9 августа 2013 г.
Выявление новых технологических трендов: проблемы и перспективы
Хорошевский В. Ф., В кн.: Тринадцатая национальная конференция по искусственному интеллекту с международным участием КИИ-2012 (16-20 октября 2012 г., г. Белгород, Россия). Том 1Т. 1: Тринадцатая национальная конференция по искусственному интеллекту с международным участием КИИ-2012 (16-20 октября 2012 г., г. Белгород, Россия).: Белгород: Российская ассоциация искусственного интеллекта, 2012. С. 252–258.
В докладе обсуждаются вопросы автоматизации процессов выявления новых технологических трендов на основе обработки документов разных жанров. Представлен гибридный подход к выявлению новых технологических трендов, где для повышения качества результатов используются методы и средства статистической обработки коллекций документов, интегрированные с методами извлечения информации из текстов. ...
Добавлено: 15 января 2013 г.
  • О ВЫШКЕ
  • Цифры и факты
  • Руководство и структура
  • Устойчивое развитие в НИУ ВШЭ
  • Преподаватели и сотрудники
  • Корпуса и общежития
  • Закупки
  • Обращения граждан в НИУ ВШЭ
  • Фонд целевого капитала
  • Противодействие коррупции
  • Сведения о доходах, расходах, об имуществе и обязательствах имущественного характера
  • Сведения об образовательной организации
  • Людям с ограниченными возможностями здоровья
  • Единая платежная страница
  • Работа в Вышке
  • ОБРАЗОВАНИЕ
  • Лицей
  • Довузовская подготовка
  • Олимпиады
  • Прием в бакалавриат
  • Вышка+
  • Прием в магистратуру
  • Аспирантура
  • Дополнительное образование
  • Центр развития карьеры
  • Бизнес-инкубатор ВШЭ
  • Образовательные партнерства
  • Обратная связь и взаимодействие с получателями услуг
  • НАУКА
  • Научные подразделения
  • Исследовательские проекты
  • Мониторинги
  • Диссертационные советы
  • Защиты диссертаций
  • Академическое развитие
  • Конкурсы и гранты
  • Внешние научно-информационные ресурсы
  • РЕСУРСЫ
  • Библиотека
  • Издательский дом ВШЭ
  • Книжный магазин «БукВышка»
  • Типография
  • Медиацентр
  • Журналы ВШЭ
  • Публикации
  • http://www.minobrnauki.gov.ru/
    Министерство науки и высшего образования РФ
  • https://edu.gov.ru/
    Министерство просвещения РФ
  • http://www.edu.ru
    Федеральный портал «Российское образование»
  • https://elearning.hse.ru/mooc
    Массовые открытые онлайн-курсы
  • НИУ ВШЭ1993–2026
  • Адреса и контакты
  • Условия использования материалов
  • Политика конфиденциальности
  • Правила применения рекомендательных технологий в НИУ ВШЭ
  • Карта сайта
Редактору