Система ALEX как средство для многоцелевой автоматизированной обработки текстов

Соколова Е. Г.; Жигалов В.; Кононенко И. С.; Жуков А. А.; С. Ю. Толдова

?

Система ALEX как средство для многоцелевой автоматизированной обработки текстов

Соколова Е. Г., Жигалов В., Кононенко И. С., Жуков А. А., Толдова С. Ю.

В статье представлена программе многоцелевой автоматизированной обработки текстов Alex . Основой системы является технология иерархических шаблонов, Средствами системы Alex разработан словарь и набор лексических шаблонов, позволяющий структурировать исходную информацию.

Язык: русский

Ключевые слова: извлечение информации из текстов automatic text analysis автоматический анализ текста

В книге

Компьютерная лингвистика и интеллектуальные технологии. Труды международного семинара "Диалог'2002"

Т. 2. , М.: ГУП Академический научно-издательский, производственно-полиграфический и книгораспространительский центр РАН "Издательство "Наука", 2002.

Автоматическое выявление побуждений в тексте: применение методов компьютерной лингвистики в работе эксперта-лингвиста

П.Е. Белова, А.К. Сафарян, В кн.: Научно-практическая конференция с международным участием "Национальные и международные тенденции и перспективы развития судебной экспертизы". Сборник докладов.: Н. Новгород: Изд-во ННГУ им. Н.И. Лобачевского, 2024.

В данной статье представлено описание системы автоматического поиска и извлечения побуждений из текстов на русском языке FindImper, основанной на поиске глагольных форм и синтаксических связей. Алгоритм реализован на языке программирования Python с использованием библиотек для морфологического и синтаксического анализа и набора правил. Данный инструмент направлен на оптимизацию работы эксперта-лингвиста и доступен к использованию через веб-сайт ...

Добавлено: 30 января 2026 г.

Субъективная трудность текстов виртуального тура по Эрмитажу: пилотное исследование

Колмогорова П. А., Куликова Е. Р., Человек: образ и сущность. Гуманитарные аспекты 2025 № 2(62) С. 139–155

В статье обсуждается вопрос оценки трудности текстов, сопровождающих виртуальный тур по Главному музейному комплексу Государственного Эрмитажа. Методика оценки трудности, в отличие от сложности как более объективной, поддающейся параметризации характеристики текста, представляется открытым вопросом. В статье описываются результаты пилотного эксперимента, в котором информанты оценивали тексты, выделяя и комментируя фрагменты, вызывающие затруднения. Анализ показал, что наиболее частыми ...

Добавлено: 8 ноября 2024 г.

Лингвистическая сложность текстов жанра «виртуальная экскурсия по музею» (на материале виртуального визита в Государственный Эрмитаж)

Колмогорова А. В., Куликова Е. Р., Колмогорова П. А., Текст. Книга. Книгоиздание 2025 № 38 С. 29–54

Статья посвящена анализу метрик лингвистической сложности текстов Виртуального визита по Главному музейному комплексу Государственного Эрмитажа, размещенного на сайте музея. Цель исследования – определить, в какой мере лингвистические характеристики данных текстов коррелируют с признаками виртуальной экскурсии по музею как речевого жанра. Значения метрик текстов виртуального визита анализируются на фоне значений аналогичных метрик научных искусствоведческих текстов и ...

Добавлено: 8 ноября 2024 г.

Автоматизация процесса поиска побуждений и извлечения их из текста.

Белова П.Е., Сафарян А. К., В кн.: Современный медиатекст и судебная экспертиза: междисциплинарные связи и экспертная оценка: сборник научных работ по итогам Международной научно-практической конференции «Современный медиатекст и судебная экспертиза: междисциплинарные связи и экспертная оценка».: М.: ООО «СОЮЗКНИГ», 2023. С. 46–56.

В статье представлено описание системы автоматического поиска и извлечения побуждений из текстов на русском языке FindImper, основанной на поиске глагольных форм, выражающих значение побуждения, и реализованной на языке Python с использованием библиотек для морфологического и синтаксического анализа и набора правил. ...

Добавлено: 29 октября 2023 г.

Сравнительный анализ специальных корпусов текстов для задач безопасности

Лаврентьев А. М., Рябова Д. М., Тихомирова Е. А. и др., Вопросы кибербезопасности 2020 Т. 3 № 37 С. 58–65

Цель исследования: разработка методики сравнения специальных корпусов текстов для последующего применения в задачах идентификации экстремистских текстов. Метод: применялись частотные методы и показатель специфичности для анализа текстов в рамках корпусной платформы TXM. Полученные результаты: разработана методика сравнительного анализа специальных корпусов текстов, которая позволяет выявлять неявные связи между корпусами разнородных текстов; показана возможность использования индекса специфичности для ...

Добавлено: 31 октября 2020 г.

Semantic Coherence in Schizophrenia in Russian Written Texts

Паничева П. В., Litvinova T., , in: Proceedings of the 25th Conference of Open Innovations Association FRUCT, University of Helsinki, Helsinki, Finland.: Helsinki: IEEE, 2019. P. 241–249.

Добавлено: 29 октября 2020 г.

Алгоритм автоматического выделения жалоб пациентов из историй болезни

Грибова В. В., Шахгельдян К. И., Шалфеева Е. А. и др., В кн.: Новые информационные технологии в автоматизированных системах: материалы двадцать второго научно-технического семинара.: М.: Институт прикладной математики им. М.В. Келдыша РАН, 2019. С. 204–209.

В настоящее время медицинские организации накапливают большой объем неструктурированной информации о пациентах, для обработки которой требуются алгоритмы формализации текста. Примером такой задачи является автоматическое извлечение жалоб пациентов и их характеристик из текстов историй болезни. В данной работе предлагается алгоритм, использующий синтаксический анализ текста истории болезни, с дальнейшим уточнением семантики при помощи онтологии, содержащей описание жалоб ...

Добавлено: 30 апреля 2019 г.

Lexical, morphological and semantic correlates of the dark triad personality traits in russian facebook texts

Паничева П. В., Bogolyubova O., Ледовая Я. А., , in: Proceedings of the Artificial Intelligence and Natural Language AINL FRUCT 2016 Conference, Saint-Petersburg, Russia, 10-12 November 2016.: FRUCT Oy, 2016. P. 72–79.

*Реализация соц. сети Facebook запрещена на территории России по основаниям осуществления экстремистской деятельности. ...

Добавлено: 18 февраля 2019 г.

Инструментальная система на базе языка шаблонов LSPL: новые средства и приложения

Большакова Е. И., Иванов К. М., Тодуа А. Р., В кн.: Ломоносовские чтения: научная конференция, Москва, факультет ВМК МГУ имени М.В. Ломоносова, 17-26 апреля 2017 г.: Тезисы докладов.: М.: МГУ, МАКС Пресс, 2017. С. 123–124.

Рассматриваются новые инструментальные средства, разработанные в рамках системы извлечения информации из русскоязычных текстов по лексико-синтаксическим шаблонам, а также созданные на их базе прикладные системы. ...

Добавлено: 5 сентября 2017 г.

Система для извлечения информации из текстов на базе лексико-синтаксических шаблонов

Большакова Е. И., Иванов К. М., Сапин А. С. и др., В кн.: Пятнадцатая национальная конференция по искусственному интеллекту с международным участием КИИ-2016 (3-7 октября 2016г., г.Смоленск, Россия): Труды конференцииТ. 1.: Смоленск: Универсум, 2016. С. 14–22.

Описывается текущее состояние программной системы с открытым кодом, разработанной и применяемой для построения различных приложений по извлечению информации из текстов на русском языке. Извлекаемая информация специфицируется в виде лексико-синтаксических шаблонов и правил языка LSPL. ...

Добавлено: 5 сентября 2017 г.

Методы анализа текста в смешанном дизайне исследования

Полухина Е. В., Просянюк Д. В., Политическая наука 2015 № 2 С. 104–116

В статье рассматривается стратегия «смешивания» методов, получившая особое распространение в западной исследовательской традиции. Освещаются методы анализа текста, продемонстрирована разница между формализованным и неформализованным подходом на примере изучения образа современной России в текстах американского издания «Нью-Йорк таймс», где внимание уделено алгоритмам работы с текстами. Показано, что для изучения такого явления, как образ страны, сочетание формализованных и ...

Добавлено: 20 ноября 2015 г.

Exploring Pattern Structures of Syntactic Trees for Relation Extraction

Leeuwenberg A., Бузмаков А. В., Toussaint Y. и др., , in: Formal Concept Analysis. 13th International Conference, ICFCA 2015, Nerja, Spain, June 23-26, 2015, ProceedingsVol. 9113.: Springer, 2015. P. 153–168.

Добавлено: 22 октября 2015 г.

Методы компьютерной лингвистики и анализ текстов на естественных языках. Учебное пособие

Чеповский А. М., М.: Национальный открытый университет «ИНТУИТ», 2015.

В учебном пособии представлены методики и алгоритмы автоматического анализа текстов на естественных языках. Рассматривается применение методов компьютерной лингвистики для прикладных исследований в области информационно-поисковых систем. Предназначено для студентов, аспирантов и научных работников, изучающих методы компьютерной лингвистики и обработку текстов в информационных системах. Рекомендовано в качестве учебного пособия для студентов высших учебных заведений, обучающихся по направлениям подготовки ...

Добавлено: 21 августа 2015 г.

Analysis of Images, Social Networks and Texts Third International Conference, AIST 2014, Yekaterinburg, Russia, April 10-12, 2014, Revised Selected Papers

Berlin: Springer, 2014.

Добавлено: 13 ноября 2014 г.

Supplementary Proceedings of the 3rd International Conference on Analysis of Images, Social Networks and Texts (AIST 2014)

Ekaterinburg: CEUR Workshop Proceedings, 2014.

АИСТ'2014 — Третья Международная Научная Конференция по Анализу Изображений, Сетей и Текстов. УЧАСТНИКИ исследователи, чьи научные интересы связаны с разработкой математических моделей, алгоритмов и инструментов анализа данных; практики, которые в своей повседневной работе сталкиваются с задачами обработки и анализа графических, текстовых, и других структурированных и неструктурированных данных; студенты, интересующихся задачами анализа данных, и желающих расширить свои компетенции в области ...

Добавлено: 28 августа 2014 г.

Compyter-based processing of literary works and study of literature

Сибирцева В. Г., / NRU HSE. Series WP BRP "Linguistics". 2014. No. 7.

Современное многообразие компьютерных программ (верификаторы авторства, семантические референторы текста, облака тегов, конкордансеры, анализаторы тональности и т.п.), созданных в том числе и для гуманитарных наук - таких, как социология, психология, менеджмент, не может не обратить на себя пристальное внимание филолога. Основные проблемы недостаточного использования компьютерных инструментов в филологии заключаются в следующем: для многих программ не существует ...

Добавлено: 25 апреля 2014 г.

Dictionary-based ambiguity resolution in Russian named-entities recognition. A case study

Brykina M. M., Толдова С. Ю., Faynveyts A. V., , in: Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной Международной конференции «Диалог» (Бекасово, 29 мая - 2 июня 2013 г.). В 2-х т.Т. 1: Основная программа конференции. Вып. 12 (19).: М.: РГГУ, 2013. P. 163–177.

The Information Extraction task and the task of Named Entities recognition (NER) in unstructured texts in particular, are essential for modern Mass Media systems. The paper presents a case study of NER system for Russian. The system was built and tested on the Russian news texts. The method of ambiguity resolution under discussion is based ...

Добавлено: 13 февраля 2014 г.

Методы анализа текста: методологические основания и программная реализация

Митина О. В., Евдокименко А. С., Вестник Южно-Уральского государственного университета. Серия: Психология 2010 № 40 (216) С. 29–48

Изложена систематизация представлений о методологических принципах анализа текста и программной реализации уже разработанных методик. Методики анализа текста были систематизированы в 10 групп: интент-анализ, контент-анализ, фоносемантический анализ, дискурс-анализ, нарративный анализ, экспертная оценка текста, графематический анализ, морфологический анализ, синтаксический анализ, семантический анализ. Для каждой из групп приведены примеры программной реализации. ...

Добавлено: 14 ноября 2013 г.

Меры релевантности строка-текст в проблеме рубрикации научных статей

Артемова Е. Л., Миркин Б. Г., Бизнес-информатика 2014 № 2 С. 51–62

Проблема оценки релеватности строк и текстов возникает в различных задачах, связанных с анализом текстовой информации: информационный поиск и извлечение документов (information retrieval), вывод гипотез из текста, (textual entailment), категоризация текстов (text categorization), автоматическое реферирование текстов (automatic summarization) и при создании вопросо-ответных систем [question answering]. В этих задачах используются разные модельные и экспериментальные подходы: либо семантические, ...

Добавлено: 24 октября 2013 г.

Современные проблемы и тенденции компьютерной лингвистики

Толдова С. Ю., Ляшевская О. Н., Вопросы языкознания 2014 № 1 С. 120–145

Статья посвящена обзору современных тематик и актуальных направлений компьютерной лингвистики на основе анализа материалов одной из конференции в этой области, а именно, 24-ой Международная конференция по компьютерной лингвистике Coling2012. В ней приводится анализ основных подходов и проблемных точек в таких традиционных областях автоматической обработки текста, как автоматический морфологический и синтаксический анализ, машинный перевод и др. ...

Добавлено: 15 октября 2013 г.