• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • A
  • A
  • A
  • A
  • A
Обычная версия сайта
  • RU
  • EN
  • HSE University
  • Publications
  • Book chapter
  • Scalability and Parallelization of Sequential Processing: Big Data Demands and Information Algebras
  • RU
  • EN
Расширенный поиск
Высшая школа экономики
Национальный исследовательский университет
Priority areas
  • business informatics
  • economics
  • engineering science
  • humanitarian
  • IT and mathematics
  • law
  • management
  • mathematics
  • sociology
  • state and public administration
by year
  • 2027
  • 2026
  • 2025
  • 2024
  • 2023
  • 2022
  • 2021
  • 2020
  • 2019
  • 2018
  • 2017
  • 2016
  • 2015
  • 2014
  • 2013
  • 2012
  • 2011
  • 2010
  • 2009
  • 2008
  • 2007
  • 2006
  • 2005
  • 2004
  • 2003
  • 2002
  • 2001
  • 2000
  • 1999
  • 1998
  • 1997
  • 1996
  • 1995
  • 1994
  • 1993
  • 1992
  • 1991
  • 1990
  • 1989
  • 1988
  • 1987
  • 1986
  • 1985
  • 1984
  • 1983
  • 1982
  • 1981
  • 1980
  • 1979
  • 1978
  • 1977
  • 1976
  • 1975
  • 1974
  • 1973
  • 1972
  • 1971
  • 1970
  • 1969
  • 1968
  • 1967
  • 1966
  • 1965
  • 1964
  • 1963
  • 1958
  • More
Subject
News
June 5, 2026
Neural Network Maps as a Method for Constructing Mathematical Models
Scientists from HSE University–Nizhny Novgorod and the Institute of Physics Belgrade, Serbia, are jointly exploring the application of machine learning techniques and neural networks to the study of nonlinear dynamics. Natalya Stankevich, Leading Research Fellow at the Laboratory of Topological Methods in Dynamics of the Faculty of Informatics, Mathematics, and Computer Science at HSE University–Nizhny Novgorod, spoke to the HSE News Service about this international project.
June 5, 2026
‘In the Age of Technology, It Is Interesting to Look into the Past and Think about What We Can Take from It
Polina Tabakova decided to apply for a Philology degree at HSE in Nizhny Novgorod because she grew up in Mari El and did not want to move far away from the Russian forests. In an interview for the Young Scientists of HSE University project, she spoke about the genre of the campus novel, the existential drama of Kolobok, and a blackout version of Eugene Onegin.
June 5, 2026
HSE Scientists Develop Method to Compress Large Language Models Without Losing Quality
Researchers from the AI and Digital Science Institute at the HSE Faculty of Computer Science have developed a new compression method for large language models such as GPT and LLaMA that reduces their size by 25–36% without additional training or significant loss of accuracy. This is the first approach to use mathematical transformations—specifically, rotations of model weights—to make models more amenable to compression with structured matrices. The study results have been published in ACL Findings 2025. The code is available on GitHub.

 

Have you spotted a typo?
Highlight it, click Ctrl+Enter and send us a message. Thank you for your help!

Publications
  • Books
  • Articles
  • Chapters of books
  • Working papers
  • Report a publication
  • Research at HSE

?

Scalability and Parallelization of Sequential Processing: Big Data Demands and Information Algebras

P. 274–298.
Golubtsov P.

Procedures of sequential updating of information are important for “big data streams” processing because they avoid accumulating and storing large data sets. As a model of information accumulation, we study the Bayesian updating procedure for linear experiments. Analysis and gradual transformation of the original processing scheme in order to increase its efficiency lead to certain mathematical structures - information spaces. We show that processing can be simplified by introducing a special intermediate form of information representation. Thanks to the rich algebraic properties of the corresponding information space, it allows unifying and increasing the efficiency of the information updating. It also leads to various parallelization options for inherently sequential Bayesian procedure, which are suited for distributed data processing platforms, such as MapReduce. Besides, we will see how certain formalization of the concept of information and its algebraic properties can arise simply from adopting data processing to big data demands. Approaches and concepts developed in the paper allow to increase efficiency and uniformity of data processing and present a systematic approach to transforming sequential processing into parallel.

Language: English
Full text
DOI
Text on another site
Keywords: алгебра информацииalgebra of informationinformation spacesинформационные пространстваDistributed processingBig data streamsSequential Bayesian updatingБольшие потоки данныхПоследовательное байесовское обновлениеРаспределенная обработка

In book

Advances in Intelligent Systems and Computing book series Vol. 1127. Advances in Intelligent Systems, Computer Science and Digital Economics
Vol. 1127: Advances in Intelligent Systems, Computer Science and Digital Economics. , Switzerland: Springer, 2020.
Similar publications
Information Spaces for Big Data Processing: Unification and Parallelization of Sequential Information Accumulation Procedures
Golubtsov P., , in: 21st IEEE Conference on Business Informatics (CBI).: IEEE Computer Society, 2019. P. 212–220.
In large-scale research, data are usually collected on many sites, have a huge volume, and new data are constantly generated. Since it is often impossible to collect all the relevant data on a single computer, much attention is paid to the algorithms that provide sequential or parallel accumulation of information and do not need to ...
Added: July 31, 2019
Параллельная распределенная обработка данных и информационные пространства
Golubtsov P., В кн.: Труды конференции "Ломоносовские чтения – 2018", секция Физика. В журнале Ученые записки физического факультета Московского университета. 2018. № 5.Т. Ученые записки физического факультета Московского университета. Вып. 5: Труды конференции "Ломоносовские чтения – 2018", секция Физика.: М.: Издательство МГУ, 2018. Гл. 1850304 С. 1–11.
Данные в современных исследованиях нередко имеют огромный объем, распределены между многочисленными сайтами и постоянно пополняются. В таких случаях собрать все относящиеся к исследованию данные на одном компьютере, как правило, невозможно и непрактично, поскольку один компьютер не сможет обработать их в разумные сроки. Подходящий алгоритм анализа данных должен, параллельно работая на многих компьютерах, извлекать из каждого ...
Added: February 13, 2019
Deterministic Model for Distributed Speculative Stream Processing
Kuralenok I., Trofimov A., Marshalkin N. et al., , in: Lecture Notes in Computer ScienceVol. 11019: Advances in Databases and Information Systems .: Springer, 2018. P. 233–246.
Users of modern distributed stream processing systems have to choose between non-deterministic computations and high latency due to a need in excessive buffering. We introduce a speculative model based on MapReduce-complete set of operations that allows us to achieve determinism and low-latency. Experiments show that our prototype can outperform existing solutions due to low overhead ...
Added: February 13, 2019
Параллельная распределенная обработка данных и информационные пространства
Golubtsov P., В кн.: Ломоносовские чтения – 2018. Секция физики. Сборник тезисов докладов.: М.: Физический факультет МГУ, 2018. С. 129–134.
В работе показано, что для эффективной обработки распределенных данных ключевую роль играет возможность введения промежуточной формы представления информации, обладающей определенными алгебраическими свойствами.  Исследованы свойства информационных пространств на примере проблемы линейного оценивания в контексте распределенной обработки данных. ...
Added: January 23, 2019
Specific Features of Big Data Processing and the Concept of Information
Golubtsov P., , in: Proceedings of the Russian-French Workshop in Big Data and Applications. October 12–13, 2017, Moscow.: M.: Higher School of Economics Publishing House, 2018. P. 45–66.
The Data in “big data” sets, as a rule, have a huge volume, are distributed among numerous sites and are constantly replenished. As a result even a simplest analysis of big data faces serious difficulties. To apply traditional processing all the relevant data has to be collected in one place and arranged in the form ...
Added: January 23, 2019
Information spaces: optimizing sequential and parallel processing in big data
Golubtsov P., , in: 7th International conference "Problems of Mathematical Physics and Mathematical Modelling” (2018) Book of abstracts.: M.: National Research Nuclear University "MEPhI", 2018. P. 173–176.
The process of Bayesian information update is essentially sequential: as a result of observation, a prior information is transformed to a posterior, which is later interpreted as a prior for the next observation, etc. It is shown that this procedure can be unified and parallelized by converting both the measurement results and the original prior ...
Added: January 23, 2019
Algebra of Information in Big Data Processing
Golubtsov P., , in: INTERNATIONAL CONFERENCE INFORMATION SYSTEMS 2017 SPECIAL INTEREST GROUP ON BIG DATA PROCEEDINGS.: Assiciation of Information Systems Electronic Library (AISel), 2017. Ch. 4 P. 1–15.
In big data problems the data usually are collected on many sites, have a huge volume, and new pieces of data are constantly generated. It is often impossible to collect all the data needed for a research project on one computer, and even impractical, since one computer would not be able to process it in ...
Added: January 23, 2019
Параллельная распределенная обработка данных и информационные пространства
Golubtsov P., Ученые записки физического факультета Московского университета 2018 № 5 С. 1850304–1–1850304–11
Данные в современных исследованиях нередко имеют огромный объем, распределены между многочисленными сайтами и постоянно пополняются. В таких случаях собрать все относящиеся к исследованию данные на одном компьютере, как правило, невозможно и непрактично, поскольку один компьютер не сможет обработать их в разумные сроки. Подходящий алгоритм анализа данных должен, параллельно работая на многих компьютерах, извлекать из каждого ...
Added: January 23, 2019
Задача линейного оценивания и информация в системах больших данных
Golubtsov P., Научно-техническая информация. Серия 2: Информационные процессы и системы 2018 № 3 С. 23–30
Рассмотрена проблема трансформации процедуры оптимального линейного оценивания так, чтобы отдельные фрагменты исходных данных могли обрабатываться независимо и параллельно. Предложена форма представления промежуточной информации, позволяющая алгоритму извлекать такую информацию параллельно из каждого набора исходных данных, объединять ее и использовать для получения результата. Показано, что на построенном информационном пространстве индуцируется упорядочение,отражающее понятие качества информации. ...
Added: January 23, 2019
Переход от априорной к апостериорной информации: байесовские процедуры в распределенных крупномасштабных системах обработки данных
Golubtsov P., Научно-техническая информация. Серия 2: Информационные процессы и системы 2018 № 8 С. 14–25
Рассматривается процедура перехода от априорной к апостериорной информации для линейного эксперимента в контексте систем Больших Данных. Этот процесс носит, на первый взгляд, принципиально последовательный характер, а именно: в результате наблюдения, априорная информация трансформируется в апостериорную, которая впоследствии трактуется как априорная для следующего наблюдения, ит.д. Показано, что такая процедура может быть распараллелена и унифицирована за счет ...
Added: January 23, 2019
  • About
  • About
  • Key Figures & Facts
  • Sustainability at HSE University
  • Faculties & Departments
  • International Partnerships
  • Faculty & Staff
  • HSE Buildings
  • HSE University for Persons with Disabilities
  • Public Enquiries
  • Studies
  • Admissions
  • Programme Catalogue
  • Undergraduate
  • Graduate
  • Exchange Programmes
  • Summer University
  • Summer Schools
  • Semester in Moscow
  • Business Internship
  • Research
  • International Laboratories
  • Research Centres
  • Research Projects
  • Monitoring Studies
  • Conferences & Seminars
  • Academic Jobs
  • Yasin (April) International Academic Conference on Economic and Social Development
  • Media & Resources
  • Publications by staff
  • HSE Journals
  • Publishing House
  • iq.hse.ru: commentary by HSE experts
  • Library
  • Economic & Social Data Archive
  • Video
  • HSE Repository of Socio-Economic Information
  • HSE1993–2026
  • Contacts
  • Copyright
  • Privacy Policy
  • Site Map
Edit