?
Система ALEX как средство для многоцелевой автоматизированной обработки текстов
.
В статье представлена программе многоцелевой автоматизированной обработки текстов Alex . Основой системы является технология иерархических шаблонов, Средствами системы Alex разработан словарь и набор лексических шаблонов, позволяющий структурировать исходную информацию.
Язык:
русский
В книге
Т. 2. , М.: ГУП Академический научно-издательский, производственно-полиграфический и книгораспространительский центр РАН "Издательство "Наука", 2002.
П.Е. Белова, А.К. Сафарян, В кн.: Научно-практическая конференция с международным участием "Национальные и международные тенденции и перспективы развития судебной экспертизы". Сборник докладов.: Н. Новгород: Изд-во ННГУ им. Н.И. Лобачевского, 2024.
В данной статье представлено описание системы автоматического поиска и извлечения побуждений из текстов на русском языке FindImper, основанной на поиске глагольных форм и синтаксических связей. Алгоритм реализован на языке программирования Python с использованием библиотек для морфологического и синтаксического анализа и набора правил. Данный инструмент направлен на оптимизацию работы эксперта-лингвиста и доступен к использованию через веб-сайт ...
Добавлено: 30 января 2026 г.
Колмогорова П. А., Куликова Е. Р., Человек: образ и сущность. Гуманитарные аспекты 2025 № 2(62) С. 139–155
В статье обсуждается вопрос оценки трудности текстов, сопровождающих виртуальный тур по Главному музейному комплексу Государственного Эрмитажа. Методика оценки трудности, в отличие от сложности как более объективной, поддающейся параметризации характеристики текста, представляется открытым вопросом. В статье описываются результаты пилотного эксперимента, в котором информанты оценивали тексты, выделяя и комментируя фрагменты, вызывающие затруднения. Анализ показал, что наиболее частыми ...
Добавлено: 8 ноября 2024 г.
Статья посвящена анализу метрик лингвистической сложности текстов Виртуального визита по Главному музейному комплексу Государственного Эрмитажа, размещенного на сайте музея. Цель исследования – определить, в какой мере лингвистические характеристики данных текстов коррелируют с признаками виртуальной экскурсии по музею как речевого жанра. Значения метрик текстов виртуального визита анализируются на фоне значений аналогичных метрик научных искусствоведческих текстов и ...
Добавлено: 8 ноября 2024 г.
Белова П.Е., Сафарян А. К., В кн.: Современный медиатекст и судебная экспертиза: междисциплинарные связи и экспертная оценка: сборник научных работ по итогам Международной научно-практической конференции «Современный медиатекст и судебная экспертиза: междисциплинарные связи и экспертная оценка».: М.: ООО «СОЮЗКНИГ», 2023. С. 46–56.
В статье представлено описание системы автоматического поиска и извлечения побуждений из текстов на русском языке FindImper, основанной на поиске глагольных форм, выражающих значение побуждения, и реализованной на языке Python с использованием библиотек для морфологического и синтаксического анализа и набора правил. ...
Добавлено: 29 октября 2023 г.
Лаврентьев А. М., Рябова Д. М., Тихомирова Е. А. и др., Вопросы кибербезопасности 2020 Т. 3 № 37 С. 58–65
Цель исследования: разработка методики сравнения специальных корпусов текстов для последующего применения в задачах идентификации экстремистских текстов. Метод: применялись частотные методы и показатель специфичности для анализа текстов в рамках корпусной платформы TXM. Полученные результаты: разработана методика сравнительного анализа специальных корпусов текстов, которая позволяет выявлять неявные связи между корпусами разнородных текстов; показана возможность использования индекса специфичности для ...
Добавлено: 31 октября 2020 г.
Паничева П. В., Litvinova T., , in: Proceedings of the 25th Conference of Open Innovations Association FRUCT, University of Helsinki, Helsinki, Finland.: Helsinki: IEEE, 2019. P. 241–249.
Добавлено: 29 октября 2020 г.
Грибова В. В., Шахгельдян К. И., Шалфеева Е. А. и др., В кн.: Новые информационные технологии в автоматизированных системах: материалы двадцать второго научно-технического семинара.: М.: Институт прикладной математики им. М.В. Келдыша РАН, 2019. С. 204–209.
В настоящее время медицинские организации накапливают большой объем неструктурированной информации о пациентах, для обработки которой требуются алгоритмы формализации текста. Примером такой задачи является автоматическое извлечение жалоб пациентов и их характеристик из текстов историй болезни. В данной работе предлагается алгоритм, использующий синтаксический анализ текста истории болезни, с дальнейшим уточнением семантики при помощи онтологии, содержащей описание жалоб ...
Добавлено: 30 апреля 2019 г.
Паничева П. В., Bogolyubova O., Ледовая Я. А., , in: Proceedings of the Artificial Intelligence and Natural Language AINL FRUCT 2016 Conference, Saint-Petersburg, Russia, 10-12 November 2016.: FRUCT Oy, 2016. P. 72–79.
*Реализация соц. сети Facebook запрещена на территории России по основаниям осуществления экстремистской деятельности. ...
Добавлено: 18 февраля 2019 г.
Большакова Е. И., Иванов К. М., Тодуа А. Р., В кн.: Ломоносовские чтения: научная конференция, Москва, факультет ВМК МГУ имени М.В. Ломоносова, 17-26 апреля 2017 г.: Тезисы докладов.: М.: МГУ, МАКС Пресс, 2017. С. 123–124.
Рассматриваются новые инструментальные средства, разработанные в рамках системы извлечения информации из русскоязычных текстов по лексико-синтаксическим шаблонам, а также созданные на их базе прикладные системы. ...
Добавлено: 5 сентября 2017 г.
Большакова Е. И., Иванов К. М., Сапин А. С. и др., В кн.: Пятнадцатая национальная конференция по искусственному интеллекту с международным участием КИИ-2016 (3-7 октября 2016г., г.Смоленск, Россия): Труды конференцииТ. 1.: Смоленск: Универсум, 2016. С. 14–22.
Описывается текущее состояние программной системы с открытым кодом, разработанной и применяемой для построения различных приложений по извлечению информации из текстов на русском языке. Извлекаемая информация специфицируется в виде лексико-синтаксических шаблонов и правил языка LSPL. ...
Добавлено: 5 сентября 2017 г.
Полухина Е. В., Просянюк Д. В., Политическая наука 2015 № 2 С. 104–116
В статье рассматривается стратегия «смешивания» методов, получившая особое распространение в западной исследовательской традиции. Освещаются методы анализа текста, продемонстрирована разница между формализованным и неформализованным подходом на примере изучения образа современной России в текстах американского издания «Нью-Йорк таймс», где внимание уделено алгоритмам работы с текстами. Показано, что для изучения такого явления, как образ страны, сочетание формализованных и ...
Добавлено: 20 ноября 2015 г.
Leeuwenberg A., Бузмаков А. В., Toussaint Y. и др., , in: Formal Concept Analysis. 13th International Conference, ICFCA 2015, Nerja, Spain, June 23-26, 2015, ProceedingsVol. 9113.: Springer, 2015. P. 153–168.
Добавлено: 22 октября 2015 г.
Чеповский А. М., М.: Национальный открытый университет «ИНТУИТ», 2015.
В учебном пособии представлены методики и алгоритмы автоматического анализа текстов на естественных языках. Рассматривается применение методов компьютерной лингвистики для прикладных исследований в области информационно-поисковых систем. Предназначено для студентов, аспирантов и научных работников, изучающих методы компьютерной лингвистики и обработку текстов в информационных системах.
Рекомендовано в качестве учебного пособия для студентов высших учебных заведений, обучающихся по направлениям подготовки ...
Добавлено: 21 августа 2015 г.
Berlin: Springer, 2014.
Добавлено: 13 ноября 2014 г.
Ekaterinburg: CEUR Workshop Proceedings, 2014.
АИСТ'2014 — Третья Международная Научная Конференция по Анализу Изображений, Сетей и Текстов.
УЧАСТНИКИ
исследователи, чьи научные интересы связаны с разработкой математических моделей, алгоритмов и инструментов анализа данных;
практики, которые в своей повседневной работе сталкиваются с задачами обработки и анализа графических, текстовых, и других структурированных и неструктурированных данных;
студенты, интересующихся задачами анализа данных, и желающих расширить свои компетенции в области ...
Добавлено: 28 августа 2014 г.
Сибирцева В. Г., / NRU HSE. Series WP BRP "Linguistics". 2014. No. 7.
Современное многообразие компьютерных программ (верификаторы авторства, семантические референторы текста, облака тегов, конкордансеры, анализаторы тональности и т.п.), созданных в том числе и для гуманитарных наук - таких, как социология, психология, менеджмент, не может не обратить на себя пристальное внимание филолога. Основные проблемы недостаточного использования компьютерных инструментов в филологии заключаются в следующем: для многих программ не существует ...
Добавлено: 25 апреля 2014 г.
Brykina M. M., Толдова С. Ю., Faynveyts A. V., , in: Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной Международной конференции «Диалог» (Бекасово, 29 мая - 2 июня 2013 г.). В 2-х т.Т. 1: Основная программа конференции. Вып. 12 (19).: М.: РГГУ, 2013. P. 163–177.
The Information Extraction task and the task of Named Entities recognition (NER) in unstructured texts in particular, are essential for modern Mass Media systems. The paper presents a case study of NER system for Russian. The system was built and tested on the Russian news texts. The method of ambiguity resolution under discussion is based ...
Добавлено: 13 февраля 2014 г.
Митина О. В., Евдокименко А. С., Вестник Южно-Уральского государственного университета. Серия: Психология 2010 № 40 (216) С. 29–48
Изложена систематизация представлений о методологических принципах анализа текста и программной реализации уже разработанных методик. Методики анализа текста были систематизированы в 10 групп: интент-анализ, контент-анализ, фоносемантический анализ, дискурс-анализ, нарративный анализ, экспертная оценка текста, графематический анализ, морфологический анализ, синтаксический анализ, семантический анализ. Для каждой из групп приведены примеры программной реализации. ...
Добавлено: 14 ноября 2013 г.
Артемова Е. Л., Миркин Б. Г., Бизнес-информатика 2014 № 2 С. 51–62
Проблема оценки релеватности строк и текстов возникает в различных задачах, связанных с анализом текстовой информации: информационный поиск и извлечение документов (information retrieval), вывод гипотез из текста, (textual entailment), категоризация текстов (text categorization), автоматическое реферирование текстов (automatic summarization) и при создании вопросо-ответных систем [question answering]. В этих задачах используются разные модельные и экспериментальные подходы: либо семантические, ...
Добавлено: 24 октября 2013 г.
Толдова С. Ю., Ляшевская О. Н., Вопросы языкознания 2014 № 1 С. 120–145
Статья посвящена обзору современных тематик и актуальных направлений компьютерной лингвистики на основе анализа материалов одной из конференции в этой области, а именно, 24-ой Международная конференция по компьютерной лингвистике Coling2012. В ней приводится анализ основных подходов и проблемных точек в таких традиционных областях автоматической обработки текста, как автоматический морфологический и синтаксический анализ, машинный перевод и др. ...
Добавлено: 15 октября 2013 г.