• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • A
  • A
  • A
  • A
  • A
Обычная версия сайта
  • RU
  • EN
  • Национальный исследовательский университет «Высшая школа экономики»
  • Публикации ВШЭ
  • Глава
  • Система ALEX как средство для многоцелевой автоматизированной обработки текстов
  • RU
  • EN
Расширенный поиск
Высшая школа экономики
Национальный исследовательский университет
Приоритетные направления
  • бизнес-информатика
  • государственное и муниципальное управление
  • гуманитарные науки
  • инженерные науки
  • компьютерно-математическое
  • математика
  • менеджмент
  • право
  • социология
  • экономика
по году
  • 2027
  • 2026
  • 2025
  • 2024
  • 2023
  • 2022
  • 2021
  • 2020
  • 2019
  • 2018
  • 2017
  • 2016
  • 2015
  • 2014
  • 2013
  • 2012
  • 2011
  • 2010
  • 2009
  • 2008
  • 2007
  • 2006
  • 2005
  • 2004
  • 2003
  • 2002
  • 2001
  • 2000
  • 1999
  • 1998
  • 1997
  • 1996
  • 1995
  • 1994
  • 1993
  • 1992
  • 1991
  • 1990
  • 1989
  • 1988
  • 1987
  • 1986
  • 1985
  • 1984
  • 1983
  • 1982
  • 1981
  • 1980
  • 1979
  • 1978
  • 1977
  • 1976
  • 1975
  • 1974
  • 1973
  • 1972
  • 1971
  • 1970
  • 1969
  • 1968
  • 1967
  • 1966
  • 1965
  • 1964
  • 1963
  • 1958
  • еще
Тематика
Новости
17 июня 2026 г.
Биоинформатики НИУ ВШЭ обнаружили 20 опасных мутаций в гене, связанном с легочной артериальной гипертензией
Ученые НИУ ВШЭ совместно с коллегами из российских университетов выяснили, какие мутации в гене ACVRL1 опасны для пациентов с легочной артериальной гипертензией. Они смоделировали, как изменения в гене влияют на связывание АТФ с белком — процесс, от которого зависит передача сигналов, необходимых для работы сосудов. Оказалось, что 20 из 32 вариантов могут нарушать передачу сигнала и провоцировать болезнь. Результаты опубликованы в Journal of Structural Biology.
17 июня 2026 г.
Интеллектуальная робототехника: кадровый голод и масса возможностей
Пока на рынке мало кадров, способных заниматься разработкой интеллектуальных робототехнических систем. Между тем именно к этому идет робототехника. Как учат ее проектированию и каково будущее отрасли, в интервью IQ Media рассказал заведующий Проектно-учебной лабораторией робототехники НИУ ВШЭ Вадим Моргачев.
17 июня 2026 г.
Каким должно быть образование, чтобы готовить кадры для экономики будущего
Эти вопросы обсудят на форуме HR EXPO PRO ЛЮДЕЙ, который состоится 18-19 июня в Москве. В его работе примет участие ректор НИУ ВШЭ Никита Анисимов, федеральные министры, HR-директора компаний, ректоры вузов, эксперты. На форуме будет представлен стенд, посвященный программам ДПО НИУ ВШЭ.

 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!

Публикации
  • Книги
  • Статьи
  • Главы в книгах
  • Препринты
  • Верификация публикаций
  • Расширенный поиск
  • Правила использования материалов
  • Наука в ВШЭ

?

Система ALEX как средство для многоцелевой автоматизированной обработки текстов

.
Соколова Е. Г., Жигалов В., Кононенко И. С., Жуков А. А., Толдова С. Ю.

В статье представлена программе многоцелевой автоматизированной обработки текстов Alex . Основой системы является технология иерархических шаблонов, Средствами системы Alex разработан словарь и набор лексических шаблонов,  позволяющий структурировать исходную информацию.

Язык: русский
Ключевые слова: извлечение информации из текстовautomatic text analysisавтоматический анализ текста

В книге

Компьютерная лингвистика и интеллектуальные технологии. Труды международного семинара "Диалог'2002"
Т. 2. , М.: ГУП Академический научно-издательский, производственно-полиграфический и книгораспространительский центр РАН "Издательство "Наука", 2002.
Похожие публикации
Автоматическое выявление побуждений в тексте: применение методов компьютерной лингвистики в работе эксперта-лингвиста
П.Е. Белова, А.К. Сафарян, В кн.: Научно-практическая конференция с международным участием "Национальные и международные тенденции и перспективы развития судебной экспертизы". Сборник докладов.: Н. Новгород: Изд-во ННГУ им. Н.И. Лобачевского, 2024.
В данной статье представлено описание системы автоматического поиска и извлечения побуждений из текстов на русском языке FindImper, основанной на поиске глагольных форм и синтаксических связей. Алгоритм реализован на языке программирования Python с использованием библиотек для морфологического и синтаксического анализа и набора правил. Данный инструмент направлен на оптимизацию работы эксперта-лингвиста и доступен к использованию через веб-сайт ...
Добавлено: 30 января 2026 г.
Субъективная трудность текстов виртуального тура по Эрмитажу: пилотное исследование
Колмогорова П. А., Куликова Е. Р., Человек: образ и сущность. Гуманитарные аспекты 2025 № 2(62) С. 139–155
В статье обсуждается вопрос оценки трудности текстов, сопровождающих виртуальный тур по Главному музейному комплексу Государственного Эрмитажа. Методика оценки трудности, в отличие от сложности как более объективной, поддающейся параметризации характеристики текста, представляется открытым вопросом. В статье описываются результаты пилотного эксперимента, в котором информанты оценивали тексты, выделяя и комментируя фрагменты, вызывающие затруднения. Анализ показал, что наиболее частыми ...
Добавлено: 8 ноября 2024 г.
Лингвистическая сложность текстов жанра «виртуальная экскурсия по музею» (на материале виртуального визита в Государственный Эрмитаж)
Колмогорова А. В., Куликова Е. Р., Колмогорова П. А., Текст. Книга. Книгоиздание 2025 № 38 С. 29–54
Статья посвящена анализу метрик лингвистической сложности текстов Виртуального визита по Главному музейному комплексу Государственного Эрмитажа, размещенного на сайте музея. Цель исследования – определить, в какой мере лингвистические характеристики данных текстов коррелируют с признаками виртуальной экскурсии по музею как речевого жанра.  Значения метрик текстов виртуального визита анализируются на фоне значений аналогичных метрик научных искусствоведческих текстов и ...
Добавлено: 8 ноября 2024 г.
Автоматизация процесса поиска побуждений и извлечения их из текста.
Белова П.Е., Сафарян А. К., В кн.: Современный медиатекст и судебная экспертиза: междисциплинарные связи и экспертная оценка: сборник научных работ по итогам Международной научно-практической конференции «Современный медиатекст и судебная экспертиза: междисциплинарные связи и экспертная оценка».: М.: ООО «СОЮЗКНИГ», 2023. С. 46–56.
В статье представлено описание системы автоматического поиска и извлечения побуждений из текстов на русском языке FindImper, основанной на поиске глагольных форм, выражающих значение побуждения, и реализованной на языке Python с использованием библиотек для морфологического и синтаксического анализа и набора правил. ...
Добавлено: 29 октября 2023 г.
Сравнительный анализ специальных корпусов текстов для задач безопасности
Лаврентьев А. М., Рябова Д. М., Тихомирова Е. А. и др., Вопросы кибербезопасности 2020 Т. 3 № 37 С. 58–65
Цель исследования: разработка методики сравнения специальных корпусов текстов для последующего применения в задачах идентификации экстремистских текстов. Метод: применялись частотные методы и показатель специфичности для анализа текстов в рамках корпусной платформы TXM. Полученные результаты: разработана методика сравнительного анализа специальных корпусов текстов, которая позволяет выявлять неявные связи между корпусами разнородных текстов; показана возможность использования индекса специфичности для ...
Добавлено: 31 октября 2020 г.
Semantic Coherence in Schizophrenia in Russian Written Texts
Паничева П. В., Litvinova T., , in: Proceedings of the 25th Conference of Open Innovations Association FRUCT, University of Helsinki, Helsinki, Finland.: Helsinki: IEEE, 2019. P. 241–249.
Добавлено: 29 октября 2020 г.
Алгоритм автоматического выделения жалоб пациентов из историй болезни
Грибова В. В., Шахгельдян К. И., Шалфеева Е. А. и др., В кн.: Новые информационные технологии в автоматизированных системах: материалы двадцать второго научно-технического семинара.: М.: Институт прикладной математики им. М.В. Келдыша РАН, 2019. С. 204–209.
В настоящее время медицинские организации накапливают большой объем неструктурированной информации о пациентах, для обработки которой требуются алгоритмы формализации текста. Примером такой задачи является автоматическое извлечение жалоб пациентов и их характеристик из текстов историй болезни. В данной работе предлагается алгоритм, использующий синтаксический анализ текста истории болезни, с дальнейшим уточнением семантики при помощи онтологии, содержащей описание жалоб ...
Добавлено: 30 апреля 2019 г.
Lexical, morphological and semantic correlates of the dark triad personality traits in russian facebook texts
Паничева П. В., Bogolyubova O., Ледовая Я. А., , in: Proceedings of the Artificial Intelligence and Natural Language AINL FRUCT 2016 Conference, Saint-Petersburg, Russia, 10-12 November 2016.: FRUCT Oy, 2016. P. 72–79.
*Реализация соц. сети Facebook запрещена на территории России по основаниям осуществления экстремистской деятельности. ...
Добавлено: 18 февраля 2019 г.
Инструментальная система на базе языка шаблонов LSPL: новые средства и приложения
Большакова Е. И., Иванов К. М., Тодуа А. Р., В кн.: Ломоносовские чтения: научная конференция, Москва, факультет ВМК МГУ имени М.В. Ломоносова, 17-26 апреля 2017 г.: Тезисы докладов.: М.: МГУ, МАКС Пресс, 2017. С. 123–124.
Рассматриваются новые инструментальные средства, разработанные в рамках системы извлечения информации из русскоязычных текстов по лексико-синтаксическим шаблонам, а также созданные на их базе прикладные системы. ...
Добавлено: 5 сентября 2017 г.
Система для извлечения информации из текстов на базе лексико-синтаксических шаблонов
Большакова Е. И., Иванов К. М., Сапин А. С. и др., В кн.: Пятнадцатая национальная конференция по искусственному интеллекту с международным участием КИИ-2016 (3-7 октября 2016г., г.Смоленск, Россия): Труды конференцииТ. 1.: Смоленск: Универсум, 2016. С. 14–22.
Описывается текущее состояние программной системы с открытым кодом, разработанной и применяемой для построения различных приложений по извлечению информации из текстов на русском языке. Извлекаемая информация специфицируется в виде лексико-синтаксических шаблонов и правил языка LSPL. ...
Добавлено: 5 сентября 2017 г.
Методы анализа текста в смешанном дизайне исследования
Полухина Е. В., Просянюк Д. В., Политическая наука 2015 № 2 С. 104–116
В статье рассматривается стратегия «смешивания» методов, получившая особое распространение в западной исследовательской традиции. Освещаются методы анализа текста, продемонстрирована разница между формализованным и неформализованным подходом на примере изучения образа современной России в текстах американского издания «Нью-Йорк таймс», где внимание уделено алгоритмам работы с текстами. Показано, что для изучения такого явления, как образ страны, сочетание формализованных и ...
Добавлено: 20 ноября 2015 г.
Exploring Pattern Structures of Syntactic Trees for Relation Extraction
Leeuwenberg A., Бузмаков А. В., Toussaint Y. и др., , in: Formal Concept Analysis. 13th International Conference, ICFCA 2015, Nerja, Spain, June 23-26, 2015, ProceedingsVol. 9113.: Springer, 2015. P. 153–168.
Добавлено: 22 октября 2015 г.
Методы компьютерной лингвистики и анализ текстов на естественных языках. Учебное пособие
Чеповский А. М., М.: Национальный открытый университет «ИНТУИТ», 2015.
В учебном пособии представлены методики и алгоритмы автоматического анализа текстов на естественных языках. Рассматривается применение методов компьютерной лингвистики для прикладных исследований в области информационно-поисковых систем. Предназначено для студентов, аспирантов и научных работников, изучающих методы компьютерной лингвистики и обработку текстов в информационных системах. Рекомендовано в качестве учебного пособия для студентов высших учебных заведений, обучающихся по направлениям подготовки ...
Добавлено: 21 августа 2015 г.
Analysis of Images, Social Networks and Texts Third International Conference, AIST 2014, Yekaterinburg, Russia, April 10-12, 2014, Revised Selected Papers
Berlin: Springer, 2014.
Добавлено: 13 ноября 2014 г.
Supplementary Proceedings of the 3rd International Conference on Analysis of Images, Social Networks and Texts (AIST 2014)
Ekaterinburg: CEUR Workshop Proceedings, 2014.
АИСТ'2014 — Третья Международная Научная Конференция по Анализу Изображений, Сетей и Текстов. УЧАСТНИКИ исследователи, чьи научные интересы связаны с разработкой математических моделей, алгоритмов и инструментов анализа данных; практики, которые в своей повседневной работе сталкиваются с задачами обработки и анализа графических, текстовых, и других структурированных и неструктурированных данных; студенты, интересующихся задачами анализа данных, и желающих расширить свои компетенции в области ...
Добавлено: 28 августа 2014 г.
Compyter-based processing of literary works and study of literature
Сибирцева В. Г., / NRU HSE. Series WP BRP "Linguistics". 2014. No. 7.
Современное многообразие компьютерных программ (верификаторы авторства, семантические референторы текста, облака тегов, конкордансеры, анализаторы тональности и т.п.), созданных в том числе и для гуманитарных наук - таких, как социология, психология, менеджмент, не может не обратить на себя пристальное внимание филолога. Основные проблемы недостаточного использования компьютерных инструментов в филологии заключаются в следующем: для многих программ не существует ...
Добавлено: 25 апреля 2014 г.
Dictionary-based ambiguity resolution in Russian named-entities recognition. A case study
Brykina M. M., Толдова С. Ю., Faynveyts A. V., , in: Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной Международной конференции «Диалог» (Бекасово, 29 мая - 2 июня 2013 г.). В 2-х т.Т. 1: Основная программа конференции. Вып. 12 (19).: М.: РГГУ, 2013. P. 163–177.
The Information Extraction task and the task of Named Entities recognition (NER) in unstructured texts in particular, are essential for modern Mass Media systems. The paper presents a case study of NER system for Russian. The system was built and tested on the Russian news texts. The method of ambiguity resolution under discussion is based ...
Добавлено: 13 февраля 2014 г.
Методы анализа текста: методологические основания и программная реализация
Митина О. В., Евдокименко А. С., Вестник Южно-Уральского государственного университета. Серия: Психология 2010 № 40 (216) С. 29–48
Изложена систематизация представлений о методологических принципах анализа текста и программной реализации уже разработанных методик. Методики анализа текста были систематизированы в 10 групп: интент-анализ, контент-анализ, фоносемантический анализ, дискурс-анализ, нарративный анализ, экспертная оценка текста, графематический анализ, морфологический анализ, синтаксический анализ, семантический анализ. Для каждой из групп приведены примеры программной реализации. ...
Добавлено: 14 ноября 2013 г.
Меры релевантности строка-текст в проблеме рубрикации научных статей
Артемова Е. Л., Миркин Б. Г., Бизнес-информатика 2014 № 2 С. 51–62
Проблема оценки релеватности строк и текстов возникает в различных задачах, связанных с анализом текстовой информации: информационный поиск и извлечение документов (information retrieval),  вывод гипотез из текста, (textual entailment), категоризация текстов (text categorization), автоматическое реферирование текстов (automatic summarization) и при создании вопросо-ответных систем [question answering].   В этих задачах используются разные модельные и экспериментальные подходы: либо семантические, ...
Добавлено: 24 октября 2013 г.
Современные проблемы и тенденции компьютерной лингвистики
Толдова С. Ю., Ляшевская О. Н., Вопросы языкознания 2014 № 1 С. 120–145
Статья посвящена обзору современных тематик и актуальных направлений компьютерной лингвистики на основе анализа материалов одной из конференции в этой области, а именно, 24-ой Международная конференция по компьютерной лингвистике Coling2012.  В ней приводится анализ основных подходов и проблемных точек в таких традиционных областях автоматической обработки текста, как автоматический морфологический и синтаксический анализ, машинный перевод и др. ...
Добавлено: 15 октября 2013 г.
  • О ВЫШКЕ
  • Цифры и факты
  • Руководство и структура
  • Устойчивое развитие в НИУ ВШЭ
  • Преподаватели и сотрудники
  • Корпуса и общежития
  • Закупки
  • Обращения граждан в НИУ ВШЭ
  • Фонд целевого капитала
  • Противодействие коррупции
  • Сведения о доходах, расходах, об имуществе и обязательствах имущественного характера
  • Сведения об образовательной организации
  • Людям с ограниченными возможностями здоровья
  • Единая платежная страница
  • Работа в Вышке
  • ОБРАЗОВАНИЕ
  • Лицей
  • Довузовская подготовка
  • Олимпиады
  • Прием в бакалавриат
  • Вышка+
  • Прием в магистратуру
  • Аспирантура
  • Дополнительное образование
  • Центр развития карьеры
  • Бизнес-инкубатор ВШЭ
  • Образовательные партнерства
  • Обратная связь и взаимодействие с получателями услуг
  • НАУКА
  • Научные подразделения
  • Исследовательские проекты
  • Мониторинги
  • Диссертационные советы
  • Защиты диссертаций
  • Академическое развитие
  • Конкурсы и гранты
  • Внешние научно-информационные ресурсы
  • РЕСУРСЫ
  • Библиотека
  • Издательский дом ВШЭ
  • Книжный магазин «БукВышка»
  • Типография
  • Медиацентр
  • Журналы ВШЭ
  • Публикации
  • http://www.minobrnauki.gov.ru/
    Министерство науки и высшего образования РФ
  • https://edu.gov.ru/
    Министерство просвещения РФ
  • http://www.edu.ru
    Федеральный портал «Российское образование»
  • https://elearning.hse.ru/mooc
    Массовые открытые онлайн-курсы
  • НИУ ВШЭ1993–2026
  • Адреса и контакты
  • Условия использования материалов
  • Политика конфиденциальности
  • Правила применения рекомендательных технологий в НИУ ВШЭ
  • Карта сайта
Редактору