• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • A
  • A
  • A
  • A
  • A
Обычная версия сайта
  • RU
  • EN
  • Национальный исследовательский университет «Высшая школа экономики»
  • Публикации ВШЭ
  • Статьи
  • Big Data Normalization for Massively Parallel Processing Databases
  • RU
  • EN
Расширенный поиск
Высшая школа экономики
Национальный исследовательский университет
Приоритетные направления
  • бизнес-информатика
  • государственное и муниципальное управление
  • гуманитарные науки
  • инженерные науки
  • компьютерно-математическое
  • математика
  • менеджмент
  • право
  • социология
  • экономика
по году
  • 2027
  • 2026
  • 2025
  • 2024
  • 2023
  • 2022
  • 2021
  • 2020
  • 2019
  • 2018
  • 2017
  • 2016
  • 2015
  • 2014
  • 2013
  • 2012
  • 2011
  • 2010
  • 2009
  • 2008
  • 2007
  • 2006
  • 2005
  • 2004
  • 2003
  • 2002
  • 2001
  • 2000
  • 1999
  • 1998
  • 1997
  • 1996
  • 1995
  • 1994
  • 1993
  • 1992
  • 1991
  • 1990
  • 1989
  • 1988
  • 1987
  • 1986
  • 1985
  • 1984
  • 1983
  • 1982
  • 1981
  • 1980
  • 1979
  • 1978
  • 1977
  • 1976
  • 1975
  • 1974
  • 1973
  • 1972
  • 1971
  • 1970
  • 1969
  • 1968
  • 1967
  • 1966
  • 1965
  • 1964
  • 1963
  • 1958
  • еще
Тематика
Новости
21 мая 2026 г.
«Пик глупости» и «долина отчаяния»: экономисты НИУ ВШЭ предложили объяснение эффекта Даннинга - Крюгера
Эффект Даннинга — Крюгера, который описывает резкий всплеск уверенности в своих силах у новичков и такое же стремительное ее падение при наборе опыта, объясняется особенностями процесса обучения и набора новых знаний. К такому выводу пришли сотрудник факультета экономических наук НИУ ВШЭ Андрей Ворчик вместе с независимым исследователем Муратом Мамышевым. Они разработали математическую модель процесса обучения и показали, как формируется и изменяется субъективная уверенность по мере накопления знаний и как  преподаватель может уменьшить «долину отчаяния» для ученика.
20 мая 2026 г.
«Еж» против «родственника»: ученые измерили, как мозг реагирует на неожиданные слова в живой речи
Российские нейрофизиологи с участием исследователей из НИУ ВШЭ показали, что изучать восприятие живой речи можно с помощью вызванных потенциалов. Они доказали, что метод применим не только к отдельным словам, но и к непрерывной речи. Оказалось, что слова, сильно отличающиеся по смыслу от предыдущего контекста, мозг обрабатывает дольше, а служебные слова анализирует в два этапа: сначала определяет их грамматическую роль, а затем на этой основе предсказывает следующее слово. Исследование опубликовано в журнале Frontiers in Human Neuroscience.
20 мая 2026 г.
Творческая работа как лекарство от выгорания
Творческая и доброжелательная атмосфера, новые методы в Международной лаборатории (впоследствии центре) социокультурных исследований привлекают молодых исследователей. За годы работы в Вышке они становятся учеными и преподавателями, известными в России и за рубежом. О своем пути в центре и в Вышке, исследованиях и роли наставников в научных успехах рассказали главный научный сотрудник ЦСКИ Зарина Лепшокова и ведущий научный сотрудник Екатерина Бушина.

 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!

Публикации
  • Книги
  • Статьи
  • Главы в книгах
  • Препринты
  • Верификация публикаций
  • Расширенный поиск
  • Правила использования материалов
  • Наука в ВШЭ

?

Big Data Normalization for Massively Parallel Processing Databases

Computer Standards and Interfaces. 2017. Vol. 54. No. P2. P. 86–93.
Голов Н. И., Rönnbäck L.

High performance querying and ad-hoc querying are commonly viewed as mutually exclusive goals in massively parallel processing databases. Furthermore, there is a contradiction between ease of extending the data model and ease of analysis. The modern 'Data Lake' approach, promises extreme ease of adding new data to a data model, however it is prone to eventually becoming a Data Swamp - unstructured, ungoverned, and out of control Data Lake where due to a lack of process, standards and governance, data is hard to find, hard to use and is consumed out of context. This paper introduces a novel technique, highly normalized Big Data using Anchor modeling, that provides a very efficient way to store information and utilize resources, thereby providing ad-hoc querying with high performance for the first time in massively parallel processing databases. This technique is almost as convenient for expanding data model as a Data Lake, while it is internally protected from transforming to Data Swamp. A case study of how this approach is used for a Data Warehouse at Avito over a three-year period, with estimates for and results of real data experiments carried out in HP Vertica, an MPP RDBMS, is also presented. This paper is an extension of theses from The 34th International Conference on Conceptual Modeling (ER 2015) (Golov and Rönnbäck 2015) [1], it is complemented with numerical results about key operating areas of highly normalized big data warehouse, collected over several (1-3) years of commercial operation. Also, the limitations, imposed by using a single MPP database cluster, are described, and cluster fragmentation approach is proposed. 

Приоритетные направления: компьютерно-математическое бизнес-информатика
Язык: английский
DOI
Текст на другом сайте
Ключевые слова: analyticsbig dataMPP Database Normalization Ad-hoc Querying Performance ModelingData Lake
Похожие публикации
Dataset of solubility values for organic compounds in binary mixtures of solvents at various temperatures
Беззубов С. И., Malikov D., Krasnov L. и др., Scientific data 2026 Vol. 13 Article 727
Добавлено: 19 мая 2026 г.
Natural hazard database from Internet publications: text mining with a large language model
Деркачева А. А., Сакиркина М. А., Краев Г. Н. и др., /. 2026.
Добавлено: 28 апреля 2026 г.
Балканские войны 1912–1913 гг. в современных национальных СМИ Сербии как символ единения балканских народов
Мулина А. А., В кн.: Балканские войны 1912–1913 гг.: далекие предпосылки и долгое эхо.: М.: Институт славяноведения РАН, 2024. С. 287–297.
В данной статье рассматривается вопрос отражения событий 1912–1913 гг. в национальных СМИ Сербии в 2012–2013 и 2022–2023 гг. Опираясь на «большие данные», полученные из сервиса Google, а также на материалы качественной газеты «Политика», автор анализирует особенности освещения эпизодов Балканских войн, а также запросы пользователей интернета на территории Сербии по темам, связанным с событиями 1912–1913 гг. ...
Добавлено: 21 апреля 2026 г.
Президентские выборы в Турецкой Республике в информационном пространстве стран Балканского полуострова: медиагеографический анализ
Мулина А. А., Якова Т. С., Вестник Российского университета дружбы народов. Серия: Литературоведение, журналистика 2025 Т. 30 № 1 С. 161–171
В статье представлены результаты исследования информационного пространства Балканских государств, проведенного в период президентских выборов в Турции (2023 г.): авторы обратились к этому периоду как к одному из самых ярких политических событий страны за последнее пятилетие. Цель предлагаемой работы – выявить уровень интереса к внутриполитическим событиям Турции как со стороны жителей балканских стран, так и со ...
Добавлено: 21 апреля 2026 г.
Ising models on the hydrogen peroxide and other lattices
Qin X., Deng Y., Щур Л. Н. и др., / Series arXiv "math". 2026. No. 2603.02962.
Добавлено: 20 апреля 2026 г.
Algorithmic overlaps as thermodynamic variables: from local to cluster Monte Carlo dynamics in critical phenomena
Пиле Я. Э., Deng Y., Щур Л. Н., / Series arXiv "math". 2026. No. 2604.10254.
Добавлено: 20 апреля 2026 г.
Using predefined vector systems to speed up neural network multimillion class classification
Gabdullin N., Андросов И. А., / Series Computer Science "arxiv.org". 2026.
Добавлено: 2 апреля 2026 г.
Политические эффекты государственных цифровых платформ и сервисов в автократиях
Балаян А. А., Томин Л. В., Публичная политика 2023 Т. 7 № 1-2 С. 108–117
Статья посвящена исследованию отдельных аспектов цифровизации управления в автократиях – прежде всего государственным платформам и цифровым сервисам. Анализ политических эффектов государственных платформ и сервисов проводится в более широком контексте исследования новых кибернетических элементов управления, которые дополняют/трансформируют традиционные для автократий дисциплинарные институты и электоральное «меню манипуляций». ...
Добавлено: 31 марта 2026 г.
Цифровое общество: теоретическая модель и российская действительность
Смирнов А. В., Мониторинг общественного мнения: Экономические и социальные перемены 2021 № 1 С. 129–153
В  статье рассмотрена теоретическая модель цифрового общества, основанная на  четырех концептах: сверхсвязность, платформизация, датификация и алгоритмическое управление. С помощью модели описан механизм углубления цифровизации общества— от переноса в цифровую среду отдельных практик и социальных взаимодействий до  создания социального порядка на  основе больших данных. Анализ панельных данных лонгитюдного обследования РМЭЗ НИУ ВШЭ за 2003—2018 гг. и географически привязанных данных проекта «Виртуальное население России» показал, что, ...
Добавлено: 18 марта 2026 г.
Прогнозирование миграционных процессов методами цифровой демографии
Смирнов А. В., Экономика региона 2022 Т. 18 № 1 С. 133–145
Характер и интенсивность миграционных процессов постоянно изменяются. Демографическая статистика не всегда позволяет получать актуальную информацию, принимать своевременные решения в области демографической и социальной политики. В связи с этим возрастает актуальность цифровой демографии — области исследований населения с использованием новых методов и источников данных, возникших в результате распространения интернета и цифровизации общества. Цель исследования — выявить ...
Добавлено: 18 марта 2026 г.
Направления научного сотрудничества и особенности культурного обмена России со странами Ближнего Востока и Средиземноморья по материалам современной аналитики
Васильева И. Н., Реброва Т. П., Ли О. В., Пространство науки 2024 Т. 1 № 4 С. 736–750
России приходится участвовать в борьбе за культурное влияние, которая обостряется во всем мире, и продвигать свои ценности и идеи. В этом контексте повышается актуальность и значимость культурно-гуманитарного сотрудничества со странами Ближнего Востока и Средиземноморья. В статье выявлены ключевые проблемы и выработаны рекомендации по улучшению этого сотрудничества. ...
Добавлено: 12 марта 2026 г.
Методология и задачи прикладной аналитики
Ильин Н. И., Исаков В. Б., В кн.: Прикладная аналитика: монография.: МАКС Пресс, 2025. С. 26–42.
В статье рассматриваются понятие и виды аналитики, понятие методологии аналитики. Раскрывается система методов аналитики. Вводится понятие методологического профиля аналитического исследования. Рассматриваются принципы современного аналитического исследования. ...
Добавлено: 3 марта 2026 г.
Прикладная аналитика: монография
Бахтизин А. Р., Ильин Н. И., Исаков В. Б., МАКС Пресс, 2025.
В монографии системно излагаются фундаментальные положения, основные методы и инструментальные средства прикладной аналитики. Особое внимание уделяется практическим рекомендациям аналитиков в конкретных областях: глобальные процессы, макроэкономика, наука и технологии, промышленность, топливная энергетика, строительство, сельское хозяйство, национальная безопасность, общественно-политическая система, национальные проекты и программы, демография и многое другое. Монография предназначена для аналитиков и управленцев, которые работают в ...
Добавлено: 2 марта 2026 г.
Организационно-деятельностные игры как технология аналитики
Исаков В. Б., В кн.: Лучшие аналитики России - наши современники. Выпуск 2Вып. 2.: М.: Красанд, 2025. С. 233–245.
В статье обосновывается возможность использования организационно-деятельностных игр как одной из технологий решения аналитических задач. Показаны этапы и принципы методологии проведения ОД-игр. Освещен личный опыт участия автора в ОД-играх. ...
Добавлено: 1 марта 2026 г.
Лучшие аналитики России - наши современники. Выпуск 2
Исаков В. Б., Караганов С. А., Наумкин В. В., М.: Красанд, 2025.
Сборник представляет собой результат большой и кропотливой работы группы ученых – представителей Ассоциации «Аналитика». Второй выпуск сборника включает статьи ведущих российских философов, экономистов, историков и юристов. Особое внимание уделено цивилизационной аналитике. В издании представлены ранее не публиковавшиеся материалы выдающегося социолога Александра Зиновьева. Идеями о будущем России и ее государственной идеологии делится Сергей Караганов. О роли ...
Добавлено: 1 марта 2026 г.
Improving guest satisfaction by identifying hotel service micro-elements failures through Deep Learning of online reviews
Kazakov S., Cuesta-Valiño P., Бутковская В. П. и др., Cuadernos de Gestion 2025 Vol. 25 No. 1 P. 71–88
Добавлено: 28 февраля 2026 г.
Правовая аналитика в государственном управлении
Исаков В. Б., Академический юридический журнал 2024 Т. 25 № 3 С. 500–516
В статье раскрываются роль и место правовой аналитики в государственном управлении. В ее основе, по мнению автора, лежит анализ разнообразных юридических ситуаций. Проанализированы структурные элементы правовой аналитической ситуации, варианты ее динамики. Рассмотрены виды правовой аналитики, среди которых выделяются информационная аналитика, аналитика данных, аналитика проблем и решений, системная аналитика, проектная и прогнозная аналитика. На конкретном примере ...
Добавлено: 27 февраля 2026 г.
Data Analytics for Predicting Situational Developments in Smart Cities: Assessing User Perceptions
Харламов А. А., Pilgun M., , in: Special Issue Sensing Technology for Smart Cities: Data, Analytics, and VisualizationsVol. 24. Issue 15.: [б.и.], 2024.
Добавлено: 22 февраля 2026 г.
Special Issue Sensing Technology for Smart Cities: Data, Analytics, and Visualizations
[б.и.], 2024.
Добавлено: 15 февраля 2026 г.
ALGORITHMIZATION OF LAW ENFORCEMENT MANAGEMENT PROCESSES USING ARTIFICIAL INTELLIGENCE
Barchukov, V., Relacoes Internacionais no Mundo Atual 2024 Vol. 4 No. 46 P. 113–132
Добавлено: 20 января 2026 г.
Iterative Ricci-Foster Curvature Flow with GMM-Based Edge Pruning: A Novel Approach to Community Detection
Сорокин К. С., Бекетов М. Е., Онучин А. и др., / arxiv.org. Серия cs.SI "Social and Information Networks ". 2025.
Обнаружение сообществ в сложных сетях — фундаментальная проблема, открытая для новых подходов в различных научных областях. Мы представляем новый метод обнаружения сообществ, основанный на потоке Риччи на графах. Наша техника итеративно обновляет веса ребер (их метрические длины) в соответствии с их (комбинаторной) версией кривизны Риччи Фостера, вычисленной на основе эффективного расстояния сопротивления между узлами. Известно, ...
Добавлено: 15 января 2026 г.
Artificial Intelligence for Urban Planning and Building Smart Cities
Demekhina A., Milshina Y., , in: Artificial Intelligence Enabled Real Time Environmental Monitoring.: Springer, 2026. P. 253–281.
Добавлено: 13 января 2026 г.
Implementing Transport Coding in OMNeT++ for Message Delay Reduction
Петрованов И. С., Сергеев А. В., / Series Computer Science "arxiv.org". 2025. No. 2512.18332.
Добавлено: 24 декабря 2025 г.
Классификации и классификаторы в науке и аналитике
Исаков В. Б., Юридическая техника 2024 № 18 С. 17–31
Настоящая консультация посвящена двум тесно взаимосвязанным вопросам: в первой части рассматриваются логико-методологические основы классификационного подхода в аналитике, во второй – этот подход применяется к самой аналитике как объекту классификации, рассматриваются ее типы и виды. ...
Добавлено: 15 декабря 2025 г.
  • О ВЫШКЕ
  • Цифры и факты
  • Руководство и структура
  • Устойчивое развитие в НИУ ВШЭ
  • Преподаватели и сотрудники
  • Корпуса и общежития
  • Закупки
  • Обращения граждан в НИУ ВШЭ
  • Фонд целевого капитала
  • Противодействие коррупции
  • Сведения о доходах, расходах, об имуществе и обязательствах имущественного характера
  • Сведения об образовательной организации
  • Людям с ограниченными возможностями здоровья
  • Единая платежная страница
  • Работа в Вышке
  • ОБРАЗОВАНИЕ
  • Лицей
  • Довузовская подготовка
  • Олимпиады
  • Прием в бакалавриат
  • Вышка+
  • Прием в магистратуру
  • Аспирантура
  • Дополнительное образование
  • Центр развития карьеры
  • Бизнес-инкубатор ВШЭ
  • Образовательные партнерства
  • Обратная связь и взаимодействие с получателями услуг
  • НАУКА
  • Научные подразделения
  • Исследовательские проекты
  • Мониторинги
  • Диссертационные советы
  • Защиты диссертаций
  • Академическое развитие
  • Конкурсы и гранты
  • Внешние научно-информационные ресурсы
  • РЕСУРСЫ
  • Библиотека
  • Издательский дом ВШЭ
  • Книжный магазин «БукВышка»
  • Типография
  • Медиацентр
  • Журналы ВШЭ
  • Публикации
  • http://www.minobrnauki.gov.ru/
    Министерство науки и высшего образования РФ
  • https://edu.gov.ru/
    Министерство просвещения РФ
  • http://www.edu.ru
    Федеральный портал «Российское образование»
  • https://elearning.hse.ru/mooc
    Массовые открытые онлайн-курсы
  • НИУ ВШЭ1993–2026
  • Адреса и контакты
  • Условия использования материалов
  • Политика конфиденциальности
  • Правила применения рекомендательных технологий в НИУ ВШЭ
  • Карта сайта
Редактору