From Triconcepts to Triclusters

D. I. Ignatov; S. Kuznetsov

?

From Triconcepts to Triclusters

P. 185–200.

A vast amount of documents in the Web have duplicates, which is a challenge for developing efficient methods that would compute clusters of similar documents. In this paper we use an approach based on computing (closed) sets of attributes having large support (large extent) as clusters of similar documents. The method is tested in a series of computer experiments on large public collections of web documents and compared to other established methods and software, such as biclustering, on same datasets. Practical efficiency of different algorithms for computing frequent closed sets of attributes is compared.

Язык: английский

Полный текст

Текст на другом сайте

Ключевые слова: разработка данных (Data Mining)информационный поиск анализ формальных понятий data mining information retrieval formal concept analysis near-duplicate detection closed frequent itemsets поиск нечетких дубликатов частые замкнутые множества

В книге

Conceptual Structures: Leveraging Semantic Technologies. 17th International Conference on Conceptual Structures, ICCS 2009, Moscow, Russia, July 26-31, 2009, Proceedings

Vol. 5662. , Berlin, Heidelberg: Springer, 2009.

Advances in Information Retrieval: 48th European Conference on Information Retrieval, ECIR 2026, Delft, The Netherlands, March 29 – April 2, 2026, Proceedings, Part II. (LNCS, volume 16484)

Cham: Springer Publishing Company, 2026.

Добавлено: 18 июня 2026 г.

SMMR: Sampling-Based MMR Reranking for Faster, More Diverse, and Balanced Recommendations and Retrieval

Liakhnovich K., Lashinin O., Babkin A. и др., Proceedings of the 48th International ACM SIGIR Conference on Research and Development in Information Retrieval 2025 P. 2754–2758

Добавлено: 3 февраля 2026 г.

Advances in Information Retrieval: 47th European Conference on Information Retrieval, ECIR 2025, Lucca, Italy, April 6–10, 2025, Proceedings, Part I

Springer, 2025.

Добавлено: 17 апреля 2025 г.

Advances in Information Retrieval: 47th European Conference on Information Retrieval, ECIR 2025, Lucca, Italy, April 6–10, 2025, Proceedings, Part IV

Springer, 2025.

Добавлено: 10 апреля 2025 г.

Machine Learning and Knowledge Discovery in Databases. Applied Data Science Track. European Conference, ECML PKDD 2024, Vilnius, Lithuania, September 9–13, 2024, Proceedings, Part X. LNCS, volume 14950

Cham: Springer, 2024.

Добавлено: 22 ноября 2024 г.

2023 IEEE International Conference on Data Mining Workshops (ICDMW) 1–4 December 2023, Shanghai, China

Shanghai: IEEE Computer Society, 2023.

Добавлено: 20 марта 2024 г.

Поиск закономерностей и важности признаков в данных виктимизационного опроса

Дьяконов А. Г., Головина А. М., Прикладная математика и информатика 2023 Т. 61 № 74 С. 91–108

Описана методика поиска закономерностей с помощью решения задач машинного обучения с учителем, которая применялась при анализе данных национального виктимизационного опроса. Найдены важные признаки для моделей машинного обучения, интересные закономерности и несоответствия в данных. Описаны эксперименты по оцениванию важностей признаков разными методами. ...

Добавлено: 18 марта 2024 г.

A Note on the Number of (Maximal) Antichains in the Lattice of Set Partitions

Игнатов Д. И., , in: LNAI 14133: 28th International Conference on Conceptual Structures, ICCS 2023, Berlin, Germany, September 11–13, 2023, Proceedings. Graph-Based Representation and Reasoning.: Berlin: Springer, 2023. P. 56–69.

Добавлено: 23 ноября 2023 г.

Сентимент-анализ как метод исследования информационной повестки и общественного мнения (на примере СМИ и социальных сетей КНР)

Анташева М. С., Лобанова П. А., Исаева Ю. К. и др., Социология: методология, методы, математическое моделирование 2023 № 57 С. 7–41

Информационная повестка, транслируемая китайскими медиаресурсами, является источником актуальных данных о мнении общества в отношении ключевых вопросов социального благосостояния. Вследствие технических особенностей организации китайских веб-сайтов и необходимости привлечения дополнительных ресурсов для автоматической обработки (парсинга) текстов на китайском языке, данная тематика не представлена достаточно широко в отечественных и зарубежных исследованиях. Целью настоящей работы является демонстрация методологии и ...

Добавлено: 9 ноября 2023 г.

FCA4AI 2023 What can FCA do for Artificial Intelligence 2023 Proceedings of the 11th International Workshop "What can FCA do for Artificial Intelligence?" co-located with the 32nd International Joint Conference on Artificial Intelligence (IJCAI 2023) Macao, S.A.R. China; August 20, 2023

CEUR-WS.org, 2023.

Добавлено: 27 сентября 2023 г.

17th International Conference, ICFCA 2023, Kassel, Germany, July 17–21, 2023, Proceedings. Formal Concept Analysis, (LNCS, volume 13934)

Switzerland: Springer, 2023.

Добавлено: 27 сентября 2023 г.

Data Analysis and Optimization. In Honor of Boris Mirkin's 80th Birthday

Springer, 2023.

Добавлено: 31 августа 2023 г.

Knowledge Discovery, Knowledge Engineering and Knowledge Management: 13th International Joint Conference, IC3K 2021, Virtual Event, October 25–27, 2021, Revised Selected Papers

Springer, 2023.

Добавлено: 8 июля 2023 г.

On the Number of Maximal Antichains in Boolean Lattices for 𝑛 up to 7

Игнатов Д. И., Lobachevskii Journal of Mathematics 2023 No. 44 P. 137–146

Добавлено: 13 июня 2023 г.

Cognitive load measurement during navigation and information retrieval in digital text

Леднева Т. С., Kovalev A., Procedia Computer Science 2021 Vol. 192 P. 2720–2730

Добавлено: 27 апреля 2023 г.

Исследование и определение признаков скрытых атак на предприятии для алгоритмов машинного обучения

Золотухина М. А., Зыков С. В., Вестник Российского нового университета 2023 № 1 С. 20–28

Зачастую именно человеческий фактор ведет к распространению угроз на предприятиях. Если техническое устройство представляет собой четко работающий и слаженный механизм с возможностью при помощи диагностического оборудования проводить замеры параметров неисправностей и устранять их, то для исследования скрытых атак необходим новый компонент системы. Предприятия и промышленность в целом нуждаются в интеллектуальной системе защиты и обнаружения скрытых ...

Добавлено: 11 апреля 2023 г.

Information Systems and Design. Third International Conference, ICID 2022, Tashkent, Uzbekistan, September 12–13, 2022, Revised Selected Papers

Springer, 2023.

Добавлено: 31 марта 2023 г.

АНАЛИЗ СТРУКТУРЫ ВРЕМЕННЫХ РЯДОВ КОЛИЧЕСТВА ДЕЛ В СУДЕ

Лукьянченко П. П., Громов В. А., Бесчастнов Ю. Н. и др., Вестник кибернетики 2022 Т. 4 № 48 С. 37–48

Проведен анализ временных рядов количества новых дел в административных судах РФ двумя методами группировки временных рядов с учетом хаотичности, случайности и регулярности их структуры. Первая модель основана на плоскости «энтропия – сложность», вторая – граф «атрибут – объект». Выведено четыре группы временных рядов: регулярные, регулярные-хаотические, строго хаотические и хаотические-стохастические, из которых хаотические-стохастические оказались в большинстве, что свойственно реальным ...

Добавлено: 20 марта 2023 г.

On Shapley value interpretability in concept-based learning with formal concept analysis

Игнатов Д. И., Kwuida L., Annals of Mathematics and Artificial Intelligence 2022 Vol. 90 No. 11 P. 1197–1222

Добавлено: 31 января 2023 г.

Применение методов анализа формальных понятий для анализа временных рядов тока крови для гемодиализных больных

Громов В. А., Урманцева Н. Р., [б.и.], 2021.

В докладе рассматриваются подходы к прогнозированию на основе кластеризации, опирающиеся на методологию анализа формальных понятий. Методология применяется для кластеризации участков временного ряда с целью выделения характерных участков (мотивов), отвечающих больным с различной степенью засорённости фистулы. ...

Добавлено: 30 января 2023 г.