• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • A
  • A
  • A
  • A
  • A
Обычная версия сайта
  • RU
  • EN
  • Национальный исследовательский университет «Высшая школа экономики»
  • Публикации ВШЭ
  • Статьи
  • Определение центроидов для повышения точности порядково-инвариантной паттерн-кластеризации
  • RU
  • EN
Расширенный поиск
Высшая школа экономики
Национальный исследовательский университет
Приоритетные направления
  • бизнес-информатика
  • государственное и муниципальное управление
  • гуманитарные науки
  • инженерные науки
  • компьютерно-математическое
  • математика
  • менеджмент
  • право
  • социология
  • экономика
по году
  • 2027
  • 2026
  • 2025
  • 2024
  • 2023
  • 2022
  • 2021
  • 2020
  • 2019
  • 2018
  • 2017
  • 2016
  • 2015
  • 2014
  • 2013
  • 2012
  • 2011
  • 2010
  • 2009
  • 2008
  • 2007
  • 2006
  • 2005
  • 2004
  • 2003
  • 2002
  • 2001
  • 2000
  • 1999
  • 1998
  • 1997
  • 1996
  • 1995
  • 1994
  • 1993
  • 1992
  • 1991
  • 1990
  • 1989
  • 1988
  • 1987
  • 1986
  • 1985
  • 1984
  • 1983
  • 1982
  • 1981
  • 1980
  • 1979
  • 1978
  • 1977
  • 1976
  • 1975
  • 1974
  • 1973
  • 1972
  • 1971
  • 1970
  • 1969
  • 1968
  • 1967
  • 1966
  • 1965
  • 1964
  • 1963
  • 1958
  • еще
Тематика
Новости
15 мая 2026 г.
В НИУ ВШЭ разрабатывают нейросеть для сферы науки и инноваций
Исследователи НИУ ВШЭ учат большие языковые модели понимать русскоязычную научную терминологию, увеличивая при этом их энергоэффективность. Адаптированная модель работает в 2,7 раза быстрее и требует на 73% меньше памяти, чем исходная открытая модель, что позволяет запускать ее на более доступном оборудовании. Программа прошла государственную регистрацию.
15 мая 2026 г.
Стартовал совместный спецпроект бренд-медиа Вышки IQ Media и iFORA ИСИЭЗ
В мае 2026 года стартовал научно-популярный проект «Искусственный интеллект: технологии, данные и будущее», который стал результатом работы двух команд — проекта iFORA Института статистических исследований и экономики знаний НИУ ВШЭ и редакции бренд-медиа IQMedia. Медийно-аналитический спецпроект посвящен современному развитию искусственного интеллекта и аналитике больших данных.
14 мая 2026 г.
<a>Ученые ФКН ВШЭ представили работы в сфере ИИ и биоинформатики на ICLR 2026
Ученые Института искусственного интеллекта и цифровых наук факультета компьютерных наук ВШЭи студенты трека «ИИ360: Инженерия искусственного интеллекта» бакалаврской программы «Прикладная математика и информатика» приняли участие в международной конференции ICLR — одном из самых авторитетных мировых форумов в области машинного обучения и представления данных. В этом году конференция состоялась в Рио-де-Жанейро (Бразилия).

 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!

Публикации
  • Книги
  • Статьи
  • Главы в книгах
  • Препринты
  • Верификация публикаций
  • Расширенный поиск
  • Правила использования материалов
  • Наука в ВШЭ

?

Определение центроидов для повышения точности порядково-инвариантной паттерн-кластеризации

Управление большими системами: сборник трудов. 2019. № 78. С. 6–22.
Мячин А. Л.

Работа продолжает исследования, направленные на создание методов анализа паттернов в системе параллельных координат с независимыми от последовательности входных данных результатов. Описаны основные операции над объектами порядково-инвариантных паттерн-кластеров. Доказано утверждение о принадлежности центроида порядково-инвариантного паттерн-кластера исходному кластеру, что позволяет проводить оценку внутрикластерных расстояний «объект – центроид» в многомерном пространстве признаков. Приведены примеры выявления структурной схожести объектов в системе параллельных координат. Отмечены основные отличия методов анализа паттернов и кластерного анализа. Описана методология выявления центроида порядково-инвариантного паттерн-кластера. Предложен алгоритм объединения групп объектов на базе их структурной схожести – с одной стороны, и минимизации внутрикластерных расстояний – с другой, что позволяет повысить точность конечных результатов и частично решить проблему поиска качественно близких объектов при наличии погрешности в исходных данных. Предложенный алгоритм использует понятие внутрикластерных расстояний «объект – центроид» и удовлетворяет следующим условиям: эндогенное определение как количества, так и состава искомых
групп изучаемых объектов; невысокая (относительно) вычислительная сложность; независимость исходного разбиения от изначальной последовательности входных данных. Продемонстрирована работа предложенного алгоритма на классических наборах данных. Приведены результаты тестирования и
отмечено повышение точности кластеризации.

Приоритетные направления: компьютерно-математическое
Язык: русский
Полный текст
Текст на другом сайте
Ключевые слова: cluster analysisкластерный анализpattern analysisанализ паттерновpatternпаттерн
ПУБЛИКАЦИЯ ПОДГОТОВЛЕНА ПО РЕЗУЛЬТАТАМ ПРОЕКТА:
Исследование моделей принятия решений и анализа сложно структурированных данных (2019)
Похожие публикации
Natural hazard database from Internet publications: text mining with a large language model
Деркачева А. А., Сакиркина М. А., Краев Г. Н. и др., /. 2026.
Добавлено: 28 апреля 2026 г.
Ising models on the hydrogen peroxide and other lattices
Qin X., Deng Y., Щур Л. Н. и др., / Series arXiv "math". 2026. No. 2603.02962.
Добавлено: 20 апреля 2026 г.
Algorithmic overlaps as thermodynamic variables: from local to cluster Monte Carlo dynamics in critical phenomena
Пиле Я. Э., Deng Y., Щур Л. Н., / Series arXiv "math". 2026. No. 2604.10254.
Добавлено: 20 апреля 2026 г.
Using predefined vector systems to speed up neural network multimillion class classification
Gabdullin N., Андросов И. А., / Series Computer Science "arxiv.org". 2026.
Добавлено: 2 апреля 2026 г.
Вовлеченность обучающихся массовых открытых онлайн-курсов по продуктам вендора облачных технологий
Поросенков Г. А., Цепелевич М. М., Кизяков Д. А. и др., Информатика и образование 2025 Т. 40 № 2 С. 57–65
Исследования вовлеченности обучающихся массовых открытых онлайн-курсов (МООК), как правило, ограничиваются рассмотрением МООК, разрабатываемых образовательными и некоммерческими организациями. Однако в последние годы возрастает актуальность МООК, реализуемых компаниями-поставщиками и производителями (вендорами) информационных технологий, в том числе облачных технологий. Такие курсы имеют особенности, предусматривающие тесное взаимодействие обучающегося и вендора, что определяет актуальность изучения вовлеченности в процессе освоения материалов МООК ...
Добавлено: 18 января 2026 г.
Iterative Ricci-Foster Curvature Flow with GMM-Based Edge Pruning: A Novel Approach to Community Detection
Сорокин К. С., Бекетов М. Е., Онучин А. и др., / arxiv.org. Серия cs.SI "Social and Information Networks ". 2025.
Обнаружение сообществ в сложных сетях — фундаментальная проблема, открытая для новых подходов в различных научных областях. Мы представляем новый метод обнаружения сообществ, основанный на потоке Риччи на графах. Наша техника итеративно обновляет веса ребер (их метрические длины) в соответствии с их (комбинаторной) версией кривизны Риччи Фостера, вычисленной на основе эффективного расстояния сопротивления между узлами. Известно, ...
Добавлено: 15 января 2026 г.
Implementing Transport Coding in OMNeT++ for Message Delay Reduction
Петрованов И. С., Сергеев А. В., / Series Computer Science "arxiv.org". 2025. No. 2512.18332.
Добавлено: 24 декабря 2025 г.
Hessian-based lightweight neural network for brain vessel segmentation on a minimal training dataset
Меньшиков И. А., Бернадотт А. К., Елфимов Н. С., / Series arXie "Statistical mechanics". 2025.
Добавлено: 1 декабря 2025 г.
Determining the boundary of dynamical chaos in the generalized Chirikov map via machine learning
Чернышов Д. П., Сатанин А. М., Щур Л. Н., / Series arXiv "math". 2025.
Добавлено: 21 ноября 2025 г.
Heterogeneous profiles and trajectories of science and technology parks: evidence from Brazil
Dávila Bolliger R., Brandão Fischer B., Ferreira de Faria A. и др., The Journal of Technology Transfer 2025 Vol. 50 P. 1461–1490
Добавлено: 12 ноября 2025 г.
Динамический паттерн-анализ поведения российских банков в период 2017–2021 гг.
Сурова К. В., Алескеров Ф. Т., Солодков В. М. и др., Журнал Новой экономической ассоциации 2025 № 1(66) С. 76–96
В работе предлагается метод анализа данных в применении к исследо- ванию моделей поведения банков России в период до и во время пандемии коронавирус- ной инфекции. Исследование включает в себя источники данных с временными рядами показателей по модели CAMEL в период 2017–2021 гг. Система CAMEL является наибо- лее авторитетной и используется регуляторами для оценки и управления ...
Добавлено: 11 ноября 2025 г.
Эффективный алгоритм торговли на фондовом рынке: ретроспективный анализ, основанный на данных по S&P-500.
Рубчинский А. А., Чубарова Д. А., / Series WP7 "Математические методы анализа решений в экономике, бизнесе и политике". 2025. No. WP7/2025/01.
Добавлено: 9 ноября 2025 г.
Methodological Foundations of Validation and Quality Assessment of Pattern Analysis Results
Alexey Myachin, Studies in Systems, Decision and Control 2025 Vol. 615 P. 12–20
Добавлено: 5 ноября 2025 г.
Роль очага инфаркта мозга в определении этиологии ишемического инсульта: обзор литературы
Кулеш А. А., Мехряков С. А., Демин Д. А. и др., Неврология и нейрохирургия Восточная Европа 2025 Т. 15 № 3 С. 436–445
Этиология ишемического инсульта чрезвычайно многообразна. В соответствии с классификацией SSS-TOAST ишемический инсульт может быть обусловлен атеро-склеротическим поражением крупных артерий, кардиогенной тромбоэмболией, окклюзией мелких артерий (лакунарный), другой причиной – установленной (диссекцией, церебральным венозным тромбозом, мигренью, синдромом обратимой церебральной вазоконстрикции, антифосфолипидным синдромом др.) и неустановленной. В основе инсульта неизвестной этиологии может лежать предсердная кардиопатия, парадоксальная эмболия, канцер-ассоциированная эмболия ...
Добавлено: 20 октября 2025 г.
Тематическая структура исследований транспортной инфраструктуры и экономики: систематический обзор литературы с применением NLP
Габдукаев Э. И., Найденова Ю. Н., Паршаков П. А., Общество и экономика 2025 № 10 С. 39–55
Настоящее исследование посвящено систематическому анализу 7566 публикаций из международных рецензируемых журналов, посвящённых транспортной инфраструктуре и экономическому развитию, с применением методов машинного обучения и кластерного анализа; выявлены ключевые направления исследований. Результаты показывают четыре доминирующих тематических кластера: «зеленый» (экологичный) транспорт, цифровизация, региональные коридоры и декарбонизация. Анализ динамики тем показывает быстрое усиление интереса к переходу на альтернативные виды топлива (биотопливо, водород), уменьшению «углеродного следа» и внедрению ...
Добавлено: 10 октября 2025 г.
Diffusion on language model embeddings for protein sequence generation
Мещанинов В. П., Strashnov, P., Shevtsov A. и др., / Cornell University. Серия CoRR, arXiv:2403.03726 "Computing Research Repository,". 2025.
Дизайн белков требует глубокого понимания присущей сложности «белкового вселенной». Хотя многие работы ориентируются на условную генерацию или сосредоточены на отдельных семействах белков, базовая задача безусловной генерации остаётся недостаточно изученной и недооценённой. В этой работе мы исследуем именно этот ключевой аспект и представляем DiMA — модель, которая использует непрерывную диффузию по эмбеддингам, полученным из языковой модели для белков ESM-2, ...
Добавлено: 5 октября 2025 г.
Smoothie: Smoothing Diffusion on Token Embeddings for Text Generation
Шабалин А. М., Мещанинов В. П., Vetrov D., / Series cs.CL, arXiv:2505.18853 "Computation and Language". 2025.
Диффузионные модели достигли передовых результатов в генерации изображений, аудио и видео, однако их адаптация к тексту остаётся сложной из-за его дискретной природы. Ранее подходы либо применяют гауссовскую диффузию в непрерывных латентных пространствах, что наследует семантическую структуру, но затрудняет декодирование токенов, либо работают в пространстве категориального симплекса, что учитывает дискретность, но игнорирует семантические связи между токенами. ...
Добавлено: 5 октября 2025 г.
A Feature Engineering Framework for Computer Vision Based on Topological Data Analysis
Абрамов А. С., Чернышев В. Л., Михайлец Е. В. и др., / Series Social Science Research Network "Social Science Research Network". 2025.
Добавлено: 23 сентября 2025 г.
On the construction of frieze patterns from partitions of convex polygons by nonintersecting diagonals
Кочетков Ю. Ю., / Series arXiv.org e-print archive "arXiv.math". 2025. No. 07600.
Добавлено: 17 сентября 2025 г.
О КУЛЬТУРЕ СТРАТЕГИЧЕСКОГО ПЛАНИРОВАНИЯ ЭКОНОМИЧЕСКОГО РАЗВИТИЯ
Бураков Н. А., Якобсон Л. И., Вопросы экономики 2025 № 9 С. 27–42
Обоснована необходимость уделять внимание устойчивым свойствам индивидуальных и коллективных участников процессов стратегического планирования экономического развития (СПЭР), тогда как существующие исследования СПЭР сфокусированы преимущественно на организационно-структурной проблематике. Показана уместность использования применительно к СПЭР понятия стратегической культуры, применяемого специалистами в области военного дела и международных отношений. Оно охватывает глубинные установки субъектов, коренящиеся в ценностях и проявляющиеся в ...
Добавлено: 11 сентября 2025 г.
On one property of Catalan numbers
Кочетков Ю. Ю., / Series arXiv.org e-print archive "arXiv.math". 2025. No. 20584.
Добавлено: 9 сентября 2025 г.
A Method for Improving the Accuracy of Regression Models Based on Ordinal-Invariant Pattern Clustering
Alexey Myachin, Procedia Computer Science 2025 Vol. 266 P. 1330–1335
Добавлено: 18 августа 2025 г.
Theoretical Aspects of Formation of the Concept of «Banking Ecosystem»
Boboshko D., Трейстарь Д. М., Kulapova A., Lecture Notes in Networks and Systems 2024 No. 1092
Добавлено: 26 мая 2025 г.
Публикационная активность университетов в регионах России: оценка и анализ кластеризации
Терещенко Д. С., Левкин Н. В., Псковский регионологический журнал 2025 Т. 21 № 1 С. 22–40
Статья посвящена изучению публикационной активности университетов в субъектах Российской Федерации. Исследование основано на данных проекта OpenAlex, который предоставляет открытый и свободный доступ к информации о научных публикациях. В процессе анализа были использованы методы главных компонент и кластеризации по методу k-средних. В результате выделены три кластера регионов, существенно различающиеся по уровню и динамике публикационной активности высших ...
Добавлено: 3 апреля 2025 г.
  • О ВЫШКЕ
  • Цифры и факты
  • Руководство и структура
  • Устойчивое развитие в НИУ ВШЭ
  • Преподаватели и сотрудники
  • Корпуса и общежития
  • Закупки
  • Обращения граждан в НИУ ВШЭ
  • Фонд целевого капитала
  • Противодействие коррупции
  • Сведения о доходах, расходах, об имуществе и обязательствах имущественного характера
  • Сведения об образовательной организации
  • Людям с ограниченными возможностями здоровья
  • Единая платежная страница
  • Работа в Вышке
  • ОБРАЗОВАНИЕ
  • Лицей
  • Довузовская подготовка
  • Олимпиады
  • Прием в бакалавриат
  • Вышка+
  • Прием в магистратуру
  • Аспирантура
  • Дополнительное образование
  • Центр развития карьеры
  • Бизнес-инкубатор ВШЭ
  • Образовательные партнерства
  • Обратная связь и взаимодействие с получателями услуг
  • НАУКА
  • Научные подразделения
  • Исследовательские проекты
  • Мониторинги
  • Диссертационные советы
  • Защиты диссертаций
  • Академическое развитие
  • Конкурсы и гранты
  • Внешние научно-информационные ресурсы
  • РЕСУРСЫ
  • Библиотека
  • Издательский дом ВШЭ
  • Книжный магазин «БукВышка»
  • Типография
  • Медиацентр
  • Журналы ВШЭ
  • Публикации
  • http://www.minobrnauki.gov.ru/
    Министерство науки и высшего образования РФ
  • https://edu.gov.ru/
    Министерство просвещения РФ
  • http://www.edu.ru
    Федеральный портал «Российское образование»
  • https://elearning.hse.ru/mooc
    Массовые открытые онлайн-курсы
  • НИУ ВШЭ1993–2026
  • Адреса и контакты
  • Условия использования материалов
  • Политика конфиденциальности
  • Правила применения рекомендательных технологий в НИУ ВШЭ
  • Карта сайта
Редактору