?
KScaNN: Scalable Approximate Nearest Neighbor Search on Kunpeng
.
Senkevich O., Siyang X., Jiang T., Radionov A., Tabaszewski J., Малышев Д. С., Li Z., Xue D., Yu L., Zeng W., Wang M., Yao X., Huang S., Neshchetkin G., Pan Q., Fu Y.
Язык:
английский
Кудряшов Е. А., Мельник Д. М., Монаков А. В., Труды Института системного программирования РАН 2016 Т. 28 № 1 С. 63–80
В статье рассматривается подход к оптимизации вызовов внешних функций в позиционно-независимом коде, основанный на выдаче вызовов непосредственно через глобальную таблицу смещений (GOT), минуя таблицу компоновки процедур (PLT). Стандартные механизмы кодогенерации на операционной системе Linux предполагают создание PLT не только для основного модуля (который является позиционно-зависимым и полагается на механизм PLT для вызовов внешних процедур), но ...
Добавлено: 5 ноября 2018 г.
Камкин А. С., Татарников А. Д., Смолов С. А. и др., , in: 2015 16th International Workshop on Microprocessor and SOC Test and Verification (MTV).: IEEE, 2015. P. 1–6.
Добавлено: 18 июля 2018 г.
Татарников А. Д., Камкин А. С., Проценко А. С. и др., Труды Института системного программирования РАН 2016 Т. 28 № 6 С. 87–102
ARM — это семейство микропроцессорных архитектур, разработанных в одноименной компании. Новейшая архитектура этого семейства, ARMv8, содержит большое число команд разных типов и отличается сложной организацией виртуальной памяти (включающей аппаратную поддержку многоуровневой трансляции адресов и виртуализации); все это делает функциональную верификацию микропроцессоров этой архитектуры крайне трудной технической задачей. Неотъемлемой частью верификации микропроцессора является генерация тестовых программ ...
Добавлено: 24 ноября 2017 г.
Никольский В. П., Стегайлов В. В., Journal of Physics: Conference Series 2016 Vol. 681 No. 012049 P. 1–6
Добавлено: 6 декабря 2015 г.
Никольский В. П., Стегайлов В. В., Вычислительные методы и программирование 2015 Т. 16 С. 578–585
Суперкомпьютерные вычисления экзафлопсной эры будут неизбежно ограничены энергоэффективностью. Сегодня в качестве возможных кандидатов для этих целей рассматриваются различные микропроцессорные архитектуры. Недавно микропроцессоры с архитектурой ARM в своем развитии достигли момента, когда уже можно серьезно обсуждать их применение для высокопроизводительных вычислений. В настоящей статье представлен анализ эффективности последних версий ARM-микропроцессоров и их производительности для задач классической ...
Добавлено: 16 ноября 2015 г.