?
Multi-GPU GEMM Algorithm Performance Analysis for Nvidia and AMD GPUs Connected by NVLink and PCIe
Ch. 23. P. 281-292.
ПУБЛИКАЦИЯ ПОДГОТОВЛЕНА ПО РЕЗУЛЬТАТАМ ПРОЕКТА:
Чой Е. Р., Никольский В. П., Стегайлов В. В., , in : Parallel Computational Technologies: 16th International Conference, PCT 2022, Dubna, Russia, March 29–31, 2022, Revised Selected Papers. : Springer, 2022. Ch. 12. P. 158-171.
Добавлено: 11 августа 2022 г.
Чой Е. Р., Никольский В. П., Стегайлов В. В., , in : 2020 Global Smart Industry Conference (GloSIC). : IEEE, 2020. P. 354-361.
Добавлено: 3 декабря 2020 г.
Боголюбов Д. П., Чанкин А. А., Стемиковская К. В., Промышленные АСУ и контроллеры 2012 № 10 С. 30-35
http://asu.tgizd.ru/ru/arhiv/10536 В настоящей статье предложен один из способов параллельной реализации самоорганизующихся карт Кохонена с помощью технологии CUDA. Описывается программная реализация и результаты ее тестирования, показывающие рост производительности с увеличением размерности сети по сравнению с последовательной версией алгоритма. ...
Добавлено: 13 февраля 2013 г.
Бухаров О. Е., Боголюбов Д. П., Системный администратор 2014 № 9 С. 88-92
В статье рассматриваются вопросы разработки системы поддержки принятия решений на нейронных сетях и генетических алгоритмах, а также приводится пример успешного применения архитектуры параллельных вычислений CUDA для повышения быстродействия данной системы. ...
Добавлено: 12 сентября 2014 г.
Гостев И. М., Sibirtseva E. A., RUDN Journal of Mathematics, Information Sciences and Physics 2014 No. 4 P. 68-84
В нынешнее время бюджетные системы слежения за взглядом пользуются большим спросом в связи с широким сектором их применения, как в промышленности, так и в персональном использовании. Как правило, для наблюдения за взглядом человека необ- ходимы дополнительные устройства (например, носимые на голове камеры), однако в данном исследовании отслеживание взгляда происходит в реальном времени и основано на ...
Добавлено: 7 декабря 2014 г.
Якушев В. Л., Симбиркин В. Н., Филимонов А. В. и др., Вестник Нижегородского университета им. Н.И. Лобачевского 2012 № 4(1) С. 238-246
Приведены данные по решению итерационными методами плохообусловленных симметричных систем линейных алгебраических уравнений (СЛАУ) для набора задач строительной механики. При построении предобусловливания использовалась приближенная треугольная факторизация второго порядка точности. Для организации распараллеливания вычислений по процессорам и ядрам использо- вались библиотеки MPI и TBB соответственно. Численные эксперименты проведены на суперкомпью- тере «Ломоносов» в различных параллельных режимах. ...
Добавлено: 17 февраля 2017 г.
Бараш Л. Ю., Guskova M. S., Щур Л. Н., Programming and Computer Software 2017 Vol. 43 No. 3 P. 145-160
...
Добавлено: 24 марта 2017 г.
Лебедев П. А., Вестник Московского государственного технического университета им. Н.Э. Баумана. Серия Естественные науки 2013 № 1 (48) С. 50-60
Описан подход к реализации на программно-аппаратной платформе NVIDIA CUDA метода “четырeх русских” приведения плотных матриц с элементами из GF(2) к ступенчатому виду. Получены оценки времени работы алгоритма и рекомендации по выбору параметров алгоритма. Показано, что разработанная реализация алгоритма является самой эффективной по сравнению с существующими решениями для матриц размера 2^17 x 2^17. ...
Добавлено: 1 апреля 2013 г.
Leokhin, Y., Myagkov, A., Panfilov, P., , in : 26th DAAAM International Symposium on Intelligent Manufacturing and Automation 2015. Vol. 1.: NY : Curran Associates, Inc., 2015. P. 0656 - 0662.
In this paper, we present results of a computational evaluation of goMapReduce parallel programming model approach for solving distributed data processing problems. In some applications, particularly data center problems, including text processing the programming models can aggregate significant number of parallel processes. We first discuss the implementation of these approaches using both Linux and Plan9 ...
Добавлено: 26 ноября 2016 г.
Cham : Springer, 2018
Добавлено: 11 марта 2019 г.
Salibekyan, S., Panfilov, P., Procedia Engineering 2015 Vol. 100C P. 977-986
Historically, a typical embedded system has been designed as a control-dominated system using only a state-oriented model, such as FSMs. However, the trend in embedded systems design in recent years has been towards highly distributed architectures with support for concurrency, data and control flow, and scalable distributed computations. This implies that a different approach is ...
Добавлено: 28 декабря 2014 г.
Кондратюк Н. Д., Никольский В. П., Pavlov D. и др., International Journal of High Performance Computing Applications 2021 Vol. 35 No. 4 P. 312-324
Добавлено: 25 июня 2021 г.
Russkov A., Roman Chulkevich, Щур Л. Н., / Cornell University. Series arXiv "math". 2020. No. 2006.00561.
Добавлено: 2 июня 2020 г.
Сухорослов О. В., Journal of Parallel and Distributed Computing 2018 Vol. 118 No. 1 P. 177-188
Добавлено: 27 августа 2018 г.
Тимофеев А. В., Халилов М. Р., , in : Параллельные вычислительные технологии (ПаВТ'2020). : Chelyabinsk : ., 2020. P. 40-51.
Добавлено: 23 октября 2020 г.
Гостев И. М., В кн. : Распределенные вычисления и ГРИД-технологии в науке и образовании. Труды 5-й международной конференции Дубна, 16-21 июля 2012 г. : Дубна : Объединенный институт ядерных исследований, 2012. С. 274-279.
Решение задач по обработке изображений и распознаванию графических образов обычно
опирается на некоторою технологию, заключающую в себя последовательность некоторых
операций.В работе исследовано затрачиваемое на обработку время, которое зависит от их количества и трудоемкости, размеров входного изображения и скорости передачи информации между отдельными этапами обработки. ...
Добавлено: 19 июля 2013 г.
Сидоренко В. Г., Петров А. С., Информатизация образования и науки 2018 № 2(38) С. 51-61
Планирование логистических процессов (построение планового графика) может рассматриваться как задача направленного перебора, решаемая с учетом накладываемых на функционирование логистической системы ограничений. Ее решение требует значительных временных затрат. Для того, чтобы ускорить получение результатов рассмотрения различных вариантов планового графика, предлагается использовать параллельные вычисления. Применение параллельных вычислений накладывает ограничения на архитектуру приложения и распределение ресурсов. Это предполагает ...
Добавлено: 26 июня 2018 г.
Фурманов К. К., Никольский И. М., Прикладная математика и информатика 2015 Т. 49 С. 71-79
Рассматривается задача поиска точек сдвига матожидания временного ряда большой длины. Предполагается, что длина ряда велика (от миллиона элементов), и его анализ будет производиться на суперкомпьютере, в связи с чем возникает необходимость разработки соответствующего параллельного алгоритма. Предложен легко параллелизуемый метод обнаружения сдвигов среднего. Основная его идея - разбиение ряда на сегменты небольшой длины. Вычислителные эксперименты показали хорошую ...
Добавлено: 18 декабря 2015 г.
Кучев А. Д., Плаксин М. А., Информатика в школе 2016 Т. 122 № 9 С. 42-48
Представлены описания компьютерной игры, предназначенной для начального знакомства с параллельным программированием, а также нескольких игровых заданий. ...
Добавлено: 30 января 2017 г.
Бухаров О. Е., Мизикин А. А., Боголюбов Д. П., Промышленные АСУ и контроллеры 2013 № 7 С. 37-45
В данной статье обосновываются преимущества эволюционного подхода для решения задач разработки системы поддержки принятия решений. Рассматриваются наиболее популярные методы прогнозирования и выявления зависимостей. Приводятся преимущества использования нейронных сетей для осуществления прогнозирования и определения зависимостей между параметрами систем. Рассматриваются преимущества интервальных нейронных сетей. Оцениваются методы нахождения оптимальных входных параметров для нейронных сетей. Рассматривается реализация системы помощи ...
Добавлено: 29 ноября 2013 г.
Плаксин М. А., Информатика в школе 2017 № 4 С. 25-39
Описывается понятие «распределение ресурсов». Демонстрируется увеличение скорости в результате распараллеливания работы.В качестве примера дается разбор задания из конкурса «ТРИЗформашка-2015». ...
Добавлено: 22 октября 2017 г.
Чой Е. Р., Стегайлов В. В., , in : Supercomputing: 9th Russian Supercomputing Days, RuSCDays 2023, Moscow, Russia, September 25–26, 2023, Revised Selected Papers, Part I. : Springer, 2023. P. 100-113.
Добавлено: 26 января 2024 г.
Баканов В. М., М. : Издательство Московского государственного университета приборостроения и информатики, 2014
В пособии изложены требования науки и промышленности, приводящие к использованию многомашинных комплексов и многопроцессорных систем, которые неизбежно используют принцип параллельности вычислений, история вопроса и современное состояние проблемы, описаны основные подходы к организации многопроцессорных вычислительных систем, разработке параллельных алгоритмов численного решения задач и технологий параллельного программирования. ...
Добавлено: 3 февраля 2015 г.