DPMine/P: язык построения моделей извлечения и анализа процессов и плагины для ProM

С. А. Шершаков

?

DPMine/P: язык построения моделей извлечения и анализа процессов и плагины для ProM

С развитием информационных систем (ИС) стремительно возросли объемы данных, которыми они оперируют.

Это касается как данных, вводимых в систему различными путями, так и данных, получаемых в результате некоторой обработки, то есть выводимых этой системой на различные виды носителей информации. Из последнего типа данных можно выделить целый специальный подкласс, к которому относятся так называемые логи данных.

Количество информации, записываемой в лог в течение фиксированного интервала времени, может быть весьма существенным, делая практически невозможным ручной анализ такого лога пользователем, что сталкивает нас с так называемой проблемой "больших данных" (Big Data).

Отдельный интерес представляют т.н. процессно-ориентированные информационные системы (ПОИС, PAIS), основным понятием которых является процесс. Как и в случае со многими другими ИС, ПОИС могут порождать большие логи, содержащие в себе информацию о взаимодействии процессов во времени.

Исследованием логов ПОИС с целью извлечения знаний о процессах и построения их моделей, исследованием таких моделей занимается дисциплина Process Mining, имеющая тесные связи с извлечением данным (Data Mining), машинным обучением, моделированием и анализом моделей процессов. Основные задачи и цели Process Mining могут быть укрупненно сведены к трем ключевым проблемам: 1) извлечение модели из лога данных (process discovery), 2) проверка соответствия некоторой модели реальным данным (conformance checking) и 3) улучшение и исправление модели в соответствии с учетом изменяющихся данных (enhancement).

К настоящему моменту разработан ряд инструментов для Process Mining. Одним из наиболее распространенных инструментов является ProM — кросс-платформенное приложение с расширяемой плагинами функциональностью.

Плагины ProM выполняют задачи Process Mining с использованием различных алгоритмов, некоторые из них в настоящий момент находятся в процессе постоянного исследования и улучшения, а часть — представляет собой, в основном, историческую ценность. Большое число плагинов выполняет утилитарные и вспомогательные функции: это извлечение данных из различных источников, подготовка (преобразование) данных к формату, подходящему для использования с тем или иным алгоритмом, конвертация различных форматов между собой, визуализация и анимация полученных результатов и др.

Часто для выполнения предметно-ориентированного эксперимента приходится осуществлять последовательный запуск нескольких (иногда десятков) плагинов, каждый из которых выполняет узкую часть общей задачи. Ситуация усложняется, когда подобную последовательность запусков приходится осуществлять снова и снова, изменяя отдельные параметры отдельных плагинов, например с целью поиска оптимальных результатов. Процесс становится исключительно трудоемким в случае проведения широкомасштабных экспериментов (large-scale experiments), вовлекающих множество плагинов и определенную логику для автоматической интерпретации полученных результатов.

В данной работе (докладе) предлагается концепция языка построения моделей извлечения и анализа процессов и описание набора плагинов DPMine/P для инструмента ProM, являющихся механизмом реализации этого языка.

Разрабатываемый язык нацелен на реализацию объединения отдельных этапов эксперимента в единую последовательность, поддержку конструкций циклов и других элементов управления потоками исполнения, обладание прозрачной, но гибкой семантикой.

Рассмотрение языка осуществляется с двух уровней представления: на нижнем уровне находится инструменто-ориентированная объектная модель; на верхнем — собственно язык, базирующийся на XML, а также графическое представление, позволяющее задавать модель процесса в виде набора строительных элементов (блоков). Графическая модель преобразуется в XML-представление, которое компилируется в объектную модель, которая в свою очередь исполняется на базе инструмента Process Mining, в частном случае — ProM.

Реализация основной семантики языка осуществляется через концепцию блоков, портов, коннекторов и схем.

Блок — основной строительный элемент языка, рассматривается как элементарная операция, но необязательно таковой является. Блок, в зависимости от своего типа, реализует одиночную задачу базового инструмента (например путем вызова определенного его плагина), используется для иерархического представления сложных схем (в виде единого блока специального типа "схема"), реализует конструкции управления потоком выполнения, используется как оператор подстановки для передачи какой-то схемы в другую схему в виде параметра (вводя элементы функционального программирования) и др. По выполняемой функции блоки объединяются в иерархию типов.

Порт — объект связи, принадлежащий некоторому блоку, обладающий характеристиками направления (входные, выходные и прокси-порты) и типа данных. Используются для транспортировки объектов заданного типа в блоки и из них.

Коннектор — направленный объект связи, соединяющий два блока через их порты: выходной порт одного блока с входным портом другого.

Схема — множество взаимодействующих блоков, связанных между собой коннекторами. Является основным механизмом реализации абстрагирования, изолирования и иерархии подпроцессов.

На уровне инструмента ProM язык DPMine/P рассматривается как набор плагинов и объектов данных (являющихся входными и выходными для данных плагинов). Основным объектом является (объектная) модель эксперимента DPModel/P. Исполнение модели состоит в исполнении главной схемы этой модели (схемы верхнего уровня) с формированием отчета об исполнении (в т.ч. ошибках и др.) Исполнение модели осуществляется специальным агентом — интерпретатором, реализация которого тесно связана с базовым инструментом и для ProM'а и представляется в виде разрабатываемого плагина — DPMineExecutor.

Исполнение модели включает исполнение входящих в нее в границах главной схемы блоков. Исполнением блока является набор действий, выполняемых интерпретатором по отношению к данному блоку, в зависимости от его типа и набора входных параметров (на входных портах этого блока). Для выполнение блоков некоторой схемы в правильной последовательности, определяемой структурой связи блоков между собой, вводятся такие понятия, как зависимости блока, удовлетворение зависимостей, состояния блоков по принципу удовлетворенных зависимостей, (не)исполненности и др.

В работе рассматриваются примеры схем и последовательности исполнения различных блоков, входящих в их состав.

На верхнесреднем уровне (представления/хранения) модели, схемы и блоки имеют различное XML-представление, определяемое их типом. В работе приводятся примеры XML-описания блоков различных типов (задачи, схемы, циклы, накопители и др.) и библиотек блоков-задач, ориентированных на инструмент ProM.

Наконец, приводится рассмотрение некоторых кейсов, включающих реализацию предметно-зависимых экспериментов, описанных на разрабатываемом языке.

Язык: русский

Полный текст

Текст на другом сайте

Ключевые слова: модель инструменты анализа workflow modeling process mining formal model Извлечение и анализ процессов tool потоки работ modelling languages ProM язык моделирования

ПУБЛИКАЦИЯ ПОДГОТОВЛЕНА ПО РЕЗУЛЬТАТАМ ПРОЕКТА:

Процессно-ориентированные информационные системы (2013)

В книге

Proceedings of the 9th Central & Eastern European Software Engineering Conference in Russia

NY: ACM, 2013.

Современная модель ученических научных обществ в московской системе образования

Ольшанская С. С., Чернилевская О. Н., Михайлов К. А. и др., Научные исследования и разработки. Социально-гуманитарные исследования и технологии 2024 Т. 13 № 4 С. 17–24

Статья посвящена изучению развития научного познания современных школьников. На основании анализа ситуации и с учётом особенностей успешных российских и международных практик авторы статьи спроектировали модель научного общества учащихся города Москвы. ...

Добавлено: 11 мая 2026 г.

Имитационное моделирование. Теория и практика (ИММОД 2025)

СПб.: АО "ЦТСС", 2025.

В научном издании представлены труды Двенадцатой всероссийской научно-практической конференции по имитационному моделированию и его применению в науке и промышленности «Имитационное моделирование. Теория и практика» (ИММОД-2025) по следующим направлениям: - теоретические основы и методология имитационного и комплексного моделирования; - методы исследования и оценки качества моделей, валидация и верификации моделей; - методы и системы распределенного моделирования; - ...

Добавлено: 17 апреля 2026 г.

A Tool for Mass Generation of Random Step Environment Models with User-Defined Landscape Features

Gabdrahmanov R., Tsoy T., Martinez-Garcia E. и др., , in: Proceedings of the 21st International Conference on Informatics in Control, Automation and Robotics - (Volume 1) ICINCO 2024.: SciTePress, 2024. P. 511–518.

Добавлено: 17 марта 2026 г.

Размывание понятия «юридическая конструкция» в российской теории права

Матвеев А. Г., EX JURE 2024 № 2

Термин «юридическая конструкция» является широко распространенным в российской юридической науке. Однако обозначаемое им понятие сегодня характеризуется высокой степенью неопределенности. Один из основных подходов к пониманию юридических конструкций - учение профессора А. Ф. Черданцева. Он относил юридические конструкции к числу идеальных моделей. Однако эта точка зрения была размыта последующими ошибочными направлениями юридической мысли. Во-первых, профессор С. ...

Добавлено: 3 марта 2026 г.

Национальная система оказания международной помощи как объект анализа

Бартенев В. И., Международные процессы 2025 Т. 23 № 2 С. 6–29

Статья обобщает результаты разработки концептуальных основ анализа национальных (страновых) систем оказания международной помощи. Предложено оригинальное определение такой системы, которое стремится учесть многоаспектность феномена международной помощи, множественность субъектов, вовлечённых в её оказание в XXI веке, и их ролевых функций. Новизну дефиниции и авторского подхода в целом обеспечивает приоритизация такого параметра, как специализация на вопросах оказания помощи. ...

Добавлено: 30 декабря 2025 г.

Применение методов теории просачиваемости для решения задач потокового планирования в транспортных сетях с учетом их структурной динамики

Кочкаров А. А., Яцкин Д. В., Кочкаров Р. А., Теоретическая и прикладная экономика 2021 № 1 С. 13–20

В работе рассмотрен теоретико-графовый подход представления транспортно-логистических систем, позволяющий описывать существенные детали и процессы, происходящие в них. Исследованы вопросы поиска эффективного решения транспортно-логистических задач и связи таких решений с пропускной способностью системы и со значением коэффициента просачиваемости. В настоящей работе предложено применении теории просачиваемости в качестве прикладного инструмента описания и решения транспортно-логистических задач, описываемый подход ...

Добавлено: 7 марта 2025 г.

Проектирование транспортно-логистических систем, устойчивых к структурным разрушениям

Кочкаров А. А., Яцкин Д. В., Кочкаров Р. А., Теоретическая и прикладная экономика 2020 № 1 С. 1–9

Статья посвящена проектированию транспортно-логистических систем с заданными характеристиками устойчивости к структурным разрушениям. Показатели устойчивости отражают влияние отказа одного или нескольких узлов (каналов связи) на работоспособность уже функционирующей системы. А также в процессе проектирования системы показатели устойчивости представляют возможности для оптимизации ее структуры с точки зрения заданных представлений о надежности. Авторами уделено внимание моделированию транспортно-логистической системы на ...

Добавлено: 7 марта 2025 г.

Электронная инженерия: теория параметрической чувствительности систем

Кофанов Ю. Н., М.: ИНФРА-М, 2024.

Систематизированы методы исследования чувствительности выходных электрических, тепловых, механических и других физических характеристик систем к изменениям внутренних параметров этих процессов, моделирование которых может проводиться в области аналитических, структурных, топологических и морфологических представлений. Для полноты системного подхода автором дополнительно проведена разработка ряд новых методов. Показывается эффективность применения функций параметрической чувствительности в процессе проектирования систем с одновременно протекающими ...

Добавлено: 31 января 2025 г.

О модели развития организационно-управленческой компетенции обучающихся педагогического вуза

Еремеева Ю. Д., В кн.: Инновационные процессы в современном образовании: от идеи до практики: Материалы IV Международной научно-практической конференции с использованием дистанционных технологий.: Яр.: Ярославский филиал ПГУПС, 2024. С. 112–116.

В статье раскрываются основные научные характеристики исследования, которое связано с разработкой модели развития организационно-управленческой компетенции у обучающихся педагогического вуза. Анализ направлений педагогического образования, где организационно-управленческая компетенция формируется на базовом уровне или отсутствует, позволил обосновать актуальность проблемы, определить пути ее разрешения в контексте разработки и реализации модели и обозначить практическую значимость результатов исследования. ...

Добавлено: 31 декабря 2024 г.

Феноменология опыта переживания вины на примере “Братьев Карамазовых” Достоевского

Немчин Д. О., Торопова А. В., Journal of Siberian Federal University. Humanities & Social Sciences 2024 Т. 17 № 11 С. 2154–2164

В статье предлагается модель феноменологического анализа чувства вины на материале монологов избранных литературных персонажей (героев романа Ф. М. Достоевского «Братья Карамазовы»). Теоретической основой является методология персонологии; методы исследования – моделирование, феноменологический и герменевтический анализ художественного текста. Новизна модели заключается в выборе персонажей литературного произведения в качестве респондентов глубинного феноменологического исследования. Предполагается, что персонологическая модель анализа ...

Добавлено: 27 декабря 2024 г.

Составление ESG-рейтинга методом многокритериального ранжирования с использованием NLP на примере российских компаний

Мыльников Л. А., Сторчевой М. А., Лапина В. В. и др., Известия Иркутского государственного университета. Серия: Математика 2024 Т. 50 С. 125–142

Актуальность исследования обусловлена сложностью оценки экологической и социальной ответственности компаний в условиях ограниченного времени и сведений о них, а также возможностью автоматического сбора информации из открытых источников.. Использованы методы автоматического выделения топиков из текстовых данных, методы машинного обучения и многокритериального ранжирования, сопоставительный и экспертный анализ получаемых результатов. Для проведения экспериментов было собрано более 1200 отчетов ...

Добавлено: 4 декабря 2024 г.

Merging Directly-Follows Graphs and Sankey Diagrams for Visualizing Acyclic Processes

Дерезовский И. Д., Шаимов Н. Д., Ломазова И. А. и др., Proceedings of the Institute for System Programming of the RAS 2024 Vol. 36 No. 4 P. 155–168

В данной статье предлагается метод визуализации моделей ациклических процессов, основанный на объединении графов непосредственного следования и диаграмм Санкей. Графы непосредственного следования - популярная графическая модель для визуализации моделей дискретных процессов, в то время как диаграммы Санкей используются для представления потоковых данных. Наш метод, основанный на потоковых диаграммах, позволяет выделять на общей модели отдельные экземпляры или группы экземпляров процесса. ...

Добавлено: 3 октября 2024 г.

Discovering hierarchical process models: an approach based on events partitioning

A. K. Begicheva, I. A. Lomazova, R. A. Nesterov, Modeling and Analysis of Information Systems 2024 Vol. 31 No. 3 P. 294–315

Process mining — это область компьютерных наук, которая занимается синтезом и анализом моделей процессов на основе автоматически генерируемых журналов событий. В настоящее время многие организации используют эту технологию для оптимизации и совершенствования бизнес-процессов. Однако синтезированная модель процесса может быть слишком подробной, сложной и трудной для понимания экспертами. В работе мы рассматриваем задачу синтеза иерархической модели ...

Добавлено: 14 сентября 2024 г.

Нотация Event-driven Process Methodology для исследования информационных процессов

Мыльников Л. А., Салтыкова А. Д., Аврамович З. Ж., Научно-техническая информация. Серия 2: Информационные процессы и системы 2024 № 7 С. 19–30

Показана необходимость повышения эффективности информационной инфраструктуры и систем поддержки принятия решений в условиях динамики внешней и внутренних сред организационных систем. Описываются возможности новой нотации EPM (Event-driven Process Methodology) для информационной инфраструктуры и задач оценки эффективности информационных процессов. Представлены основные типы таких процессов, их различия и способы исследования. Сформулированы процедурные модели, позволяющие проводить исследование и сравнение ...

Добавлено: 19 августа 2024 г.

Friend or Foe: A Computational Model of Identity Construction During Political Mobilization

Andrei Akhremenko, Конча В., Journal of Social Policy Studies 2025 Vol. 23 No. 4 P. 781–794

Добавлено: 13 мая 2024 г.

Отключение интернета как теоретическая проблема политической науки, или что мы (не) понимаем в сетевой протестной мобилизации

Ахременко А. С., Полис. Политические исследования 2024 № 2 С. 118–134

В центре внимания настоящей работы – вопрос о влиянии интернет-коммуникаций на «уличную» протестную активность. В последние годы в этом направлении исследований наметилась некоторая стагнация: дефицит крупных работ, обозначающих новые исследовательские направления или хотя бы существенно укрепляющих эмпирический фундамент уже сложившихся гипотез. Парадокс состоит в том, что при рассмотрении воздействия глобальной сети на политическое поведение собственно ...

Добавлено: 31 марта 2024 г.

Searching for Deviations in Trading Systems: Combining Control-Flow and Data Perspectives

Julio C. Carrasquel, Irina A. Lomazova, , in: 6th International Conference, TMPA 2021, Tomsk, Russia, November 25–27, 2021, Revised Selected Papers. Tools and Methods of Program AnalysisVol. 1559: CCIS .: Springer, 2024. P. 94–106.

Добавлено: 31 января 2024 г.

Разработка конструктора правил генерации и обработки событийных рядов

Лядова Л. Н., Платунов А. И., Информатизация и связь 2024 № 1 С. 84–89

Резюме. Цель проекта – разработка средств генерации и предобработки журналов событий для анализа процессов с помощью методов Process Mining. Подход к реализации основан на принципах low-code. Пользователи должны иметь возможность разрабатывать собственные правила формирования и обработки журналов событий, включающих дополнительные атрибуты, – событийных рядов. В основе – многоаспектная онтология, включающая описания правил (функций) и данных. ...

Добавлено: 19 января 2024 г.

Вклад учебных предметов в развитие читательской грамотности

Пестрикова Е. А., В кн.: ХX Международная научно-практическая конференция молодых исследователей образования. Исследования, улучшающие образование.: М.: ФГБОУ ВО МГППУ, 2021. С. 594–597.

В современном мире делается серьезный акцент в сторону развития различных видов грамотности в рамках всех ступеней образования. В нашем докладе акцент сделан на читательской грамотности, которая выступает в качестве основы функциональной грамотности. ...

Добавлено: 17 января 2024 г.

Business Process Management Workshops. BPM 2023 International Workshops, Utrecht, The Netherlands, September 11–15, 2023, Revised Selected Papers

Switzerland: Springer, 2024.

Добавлено: 17 января 2024 г.

РАЗРАБОТКА КОНСТРУКТОРА ЖУРНАЛОВ СОБЫТИЙ С ДОПОЛНИТЕЛЬНЫМИ АТРИБУТАМИ

Платунов А. И., Лядова Л. Н., В кн.: ТЕХНОЛОГИИ РАЗРАБОТКИ ИНСТРУМЕНТАЛЬНЫХ СРЕДСТВ (ТРИС-2023): материалы конференции.: Таганрог: Издательство ЮФУ, 2023. С. 113–122.

Цель проекта – разработка средств генерации и обработки журналов событий с использованием дополнительных атрибутов для анализа процессов с помощью средств Process Mining. Реализация основана на принципах low-code. Это обеспечивает пользователей, не владеющих навыками программирования, возможностью разрабатывать собственные правила обработки данных для формирования и предобработки журналов событий с дополнительными атрибутами. Ядро системы – многоаспектная онтология, включающая ...

Добавлено: 16 декабря 2023 г.

An Approach to Developing Ontology-Based Tools for Event Series Analysis

Anton Platunov, Lyudmila Lyadova, Matta N. и др., , in: IC3K 2023: Proceedings of the 15th International Joint Conference on Knowledge Discovery, Knowledge Engineering and Knowledge Management. Volume 2: KEOD, Rome - Italy, November 13 - 15, 2023Vol. 2: KEOD.: Lisbon: SciTePress, 2023. P. 323–330.

Добавлено: 22 ноября 2023 г.

Using Process Mining to Leverage the Development of a Family of Mobile Applications

L.А. Rezunik, A.I. Perevoznikova, D.V. Eremina и др., Proceedings of the Institute for System Programming of the RAS 2023 Vol. 35 No. 3 P. 171–186

Коммерческие предприятия часто предоставляют свои услуги с помощью семейства приложений, разработанных для работы на различных платформах. Приложения в таком семействе могут вести себя по-разному. Процессы их разработки также могут отличаться. Более того, современные процессы разработки часто сложны, а иногда и не вполне четко определены. Это может приводить к ошибкам, дефектам и нежелательным отличиям в поведении ...

Добавлено: 30 октября 2023 г.

Личностное проживание коллективной травмы в автобиографической памяти

Старовойтенко Е. Б., Юрченко А. Ю., Мир психологии. Научно-методический журнал 2023 Т. 114 № 3 С. 44–65

Проблемой исследования, представленного в данной статье, является поиск способов личностного проживания коллективной травмы. Исследование проведено в формате общей персонологии, на основе определения специфики и сравнения кол- лективной и индивидуальной травмы, проживания коллективной травмы социумом и личностью. Личностное проживание коллективной травмы изучается с акцентом на автобиографическую память, нашедшую репрезентацию в рефлексивных текстах, или Я-нарративах. Результатами исследования ...

Добавлено: 15 октября 2023 г.