Статья
Анализ формальных понятий и его приложения
В работе даются основные определения анализа формальных понятий (АФП), рассказывается о его роли в математике и компьютерных науках, а также приводится краткий обзор его основных приложений, в том числе в программной инженерии и онтологическом моделировании.
В статье дается краткое введение в ансамбли классификаторов в машинном обучении и описывается алгоритм, повышающий качество классификации за счет рекомендации классификаторов объектам. Гипотеза, заложенная в основу алгоритма, состоит в том, что классификатор скорее правильно классифицирует объект, если он правильно предсказал метки соседей этого объекта из обучающей выборки. Автор иллюстрирует принцип алгоритма на простом примере и описывает тестирование на реальных данных.
Concept discovery is a Knowledge Discovery in Databases (KDD) research field that uses human-centered techniques such as Formal Concept Analysis (FCA), Biclustering, Triclustering, Conceptual Graphs etc. for gaining insight into the underlying conceptual structure of the data. Traditional machine learning techniques are mainly focusing on structured data whereas most data available resides in unstructured, often textual, form. Compared to traditional data mining techniques, human-centered instruments actively engage the domain expert in the discovery process. This volume contains the contributions to CDUD 2011, the International Workshop on Concept Discovery in Unstructured Data (CDUD) held in Moscow. The main goal of this workshop was to provide a forum for researchers and developers of data mining instruments working on issues with analyzing unstructured data. We are proud that we could welcome 13 valuable contributions to this volume. The majority of the accepted papers described innovative research on data discovery in unstructured texts. Authors worked on issues such as transforming unstructured into structured information by amongst others extracting keywords and opinion words from texts with Natural Language Processing methods. Multiple authors who participated in the workshop used methods from the conceptual structures field including Formal Concept Analysis and Conceptual Graphs. Applications include but are not limited to text mining police reports, sociological definitions, movie reviews, etc.
Formal Concept Analysis (FCA) is a mathematically well-founded theory aimed at data analysis and classication, introduced and detailed in the book of Bernhard Ganter and Rudolf Wille, \Formal Concept Analysis", Springer 1999. The area came into being in the early 1980s and has since then spawned over 10000 scientic publications and a variety of practically deployed tools. FCA allows one to build from a data table with objects in rows and attributes in columns a taxonomic data structure called concept lattice, which can be used for many purposes, especially for Knowledge Discovery and Information Retrieval. The \Formal Concept Analysis Meets Information Retrieval" (FCAIR) workshop collocated with the 35th European Conference on Information Retrieval (ECIR 2013) was intended, on the one hand, to attract researchers from FCA community to a broad discussion of FCA-based research on information retrieval, and, on the other hand, to promote ideas, models, and methods of FCA in the community of Information Retrieval. This volume contains 11 contributions to FCAIR workshop (including 3 abstracts for invited talks and tutorial) held in Moscow, on March 24, 2013. All submissions were assessed by at least two reviewers from the program committee of the workshop to which we express our gratitude. We would also like to thank the co-organizers and sponsors of the FCAIR workshop: Russian Foundation for Basic Research, National Research University Higher School of Economics, and Yandex.
В данной статье предлагаются два новых метода анализа данных социальных сетей. В частности, анализируются данные социальной сети ВКонтакте. Используя бикластеризацию, извлекаются группы пользователей со схожими интересами и сообщества пользователей, состоящих в схожих группах. С помощью трикластеризации интересы пользователей используются в качестве тегов для описания групп ВКонтакте. После данного процесса тегирования возможно рекомендовать конкретным пользователям релевантные группы или новых друзей, имеющих схожие предпочтения, из интересных групп. Приводятся предварительные результаты и объясняются дальнейшие приложения данных методов в случае больших данных.
Formal Concept Analysis (FCA) is an unsupervised clustering technique and many scientific papers are devoted to applying FCA in Information Retrieval (IR) research. We collected 103 papers published between 2003-2009 which mention FCA and information retrieval in the abstract, title or keywords. Using a prototype of our FCA-based toolset CORDIET, we converted the pdf-files containing the papers to plain text, indexed them with Lucene using a thesaurus containing terms related to FCA research and then created the concept lattice shown in this paper. We visualized, analyzed and explored the literature with concept lattices and discovered multiple interesting research streams in IR of which we give an extensive overview. The core contributions of this paper are the innovative application of FCA to the text mining of scientific papers and the survey of the FCA-based IR research.
Представлен метод поиска интересных паттернов в данных, описываемых сложными последовательностями, т. е. таких, у которых символы имеют структуру. Анализ формальных понятий и узорные структуры, относящиеся к прикладной теории решёток, позволяют решать рассматриваемую задачу в общем виде. Построение решётки узорных понятий представляет большую вычислительную сложность, поэтому исследуются возможности приближённого описания узорных структур, задаваемые через проекции. В статье проекции узорных структур используются не только для упрощения, но и для выделения паттернов, которые могут быть полезны для анализа предметной области. Возможность анализа таких проекций изучается на примере данных, задаваемых последовательностями госпитализаций пациентов.
Рассмотрены концептуальные вопросы моделирования бизнеса, проектного управления, роли управления персоналом в оптимизации бизнеса. Изложены концептуальные подходы к определению путей повышения эффективности управления. Дана характеристика особенностей внедрения информационных систем в экономике, значения систем управления качеством. Пособие предназначено для студентов очной и очно-заочной форм обучения по специальности «Менеджмент организации», однако может быть полезно и студентам других специальностей, изучающим дисциплины «Информационные технологии управления», «Автоматизированные информационные системы», «Информационные системы в экономике», «Управление качеством».
В данной работе рассматривается пятое уравнение Пенлеве, которое имеет 4 комплексных параметра α, β, γ, δ. Методами степенной геометрии ищутся асимптотические разложения его решений при x → ∞. При α≠0 найдено 10 степенных разложений с двумя экспоненциальными добавками каждое. Шесть из них - по целым степеням x (они были известны), и четыре по полуцелым (они новые). При α=0 найдено 4 однопараметрических семейства экспоненциальных асимптотик y(x) и 3 однопараметрических семейства сложных разложений x=x(y). Все экспоненциальные добавки, экспоненциальные асимптотики и сложные разложения найдены впервые. Также уточнена техника вычисления экспоненциальных добавок.
Пусть G — полупростая алгебраическая группа, разложение которой в произведение простых групп не содержит групп типа A, и P⊆G — параболическая подгруппа. Дополняя результаты Попова [7], мы перечисляем все тройки (G, P, n), такие что (а) в кратном многообразии флагов G/P × G/P × . . . × G/P (n множителей) существует открытая G-орбита, (б) число G-орбит на кратном многообразии флагов конечно.
Я выписываю точную формулу для (теоретико-множественной) системы результантов как набора коэффициентов одного результанта.