Глава
Performance Analysis of Computational Devices in Quantum Chemistry Tasks
В книге
http://asu.tgizd.ru/ru/arhiv/10536 В настоящей статье предложен один из способов параллельной реализации самоорганизующихся карт Кохонена с помощью технологии CUDA. Описывается программная реализация и результаты ее тестирования, показывающие рост производительности с увеличением размерности сети по сравнению с последовательной версией алгоритма.
Работа посвящена практике подготовки специалистов в области технологий программирования для многопроцессорных вычислительным систем с массовым параллелизмом в НИУ ВШЭ
The book contains selected papers that were presented on PhD Summer schools on Scientific Computing jointly organized by Waterford Institute of Technology, Lomonosov Moscow State University, Kyiv National Taras Shevchenko University, Saint-Petersburg State University and Nanjing University of Technology. The schoold were mainly organized in teleconference mode and linked researchers and PhD students from several countries.
Одной из важнейших задач при разработке автоматизированных систем научных исследований (АСНИ) является обеспечение приемлемого быстродействия вычислительных машин и обеспечение их эффективной работы. В статье рассмотрен алгоритм, реализующий разделение задач между процессорами подсистемы распределенного молекулярно-динамического моделирования информационно-исследовательской системы "Шлаковые расплавы". Предложена методика оптимизации данного алгоритма, произведена оценка эффективности и расчет ускорения предложенного решения.
Необходимость в методике преподавания темы «Параллельные вычисления» в средней школе назрела. В статье представлен трехлетний опыт работы автора в этом направлении: методический подход, отбор материала, деловые игры и их апробация на школьниках и взрослых, опыт задач на параллельные вычисления на конкурсе «ТРИЗформашка», классы задач, примеры задач, программные исполнители, тексты для пропедевтического учебника информатики.
Рассматриваются вопросы выявле́ния скрытого параллелизма в алгорит-мах путем я́вного (построение ярусно-параллельной формы графа алгоритма) и нея́вного (методика пото́ковых - DATA-FLOW - вычислений), разработки параллельных программ в MPI-парадигме программирования и количествен-ного исследования величины ускорения вычислений при параллелизации от параметров многопроцессорной вычислительной системы и качества парал-лельных программ. Пособие имеет практическую направленность и может быть использовано студентами для подготовки к выполнению лабораторных и практических ра-бот, курсовых и дипломных проектов. Создаваемые сетевые приложения ра-ботоспособны в многопроцессорной среде архитектуры MPP (Massively Par-allel Processing); в частности, на Linux-вычислительном кластере кафедры ИТ-4 МГУПИ. Перед проведением работ желательно ознакомиться с кон-спектом лекций по дисциплине ‘Параллельные вычисления’.
В пособии изложены требования науки и промышленности, приводящие к использованию многомашинных комплексов и многопроцессорных систем, которые неизбежно используют принцип параллельности вычислений, история вопроса и современное состояние проблемы, описаны основные подходы к организации многопроцессорных вычислительных систем, разработке параллельных алгоритмов численного решения задач и технологий параллельного программирования.
The research subject is the computational complexity of the probabilistic neural network (PNN) in the pattern recognition problem for large model databases. We examined the following methods of increasing the efficiency of a neuralnetwork classifier: a parallel multithread realization, reducing the PNN to a criterion with testing of homogeneity of feature histograms of input and reference images, approximate nearestneighbor analyses (BestBin First, directed enumeration methods). The approach was tested in facialrecognition experiments with FERET dataset.