Locality optimization on a NUMA architecture for hybrid LU factorization

Abstract : We study the impact of non-uniform memory accesses (NUMA) on the solution of dense general linear systems using an LU factorization algorithm. In particular we illustrate how an appropriate placement of the threads and memory on a NUMA architecture can improve the performance of the panel factorization and consequently accelerate the global LU factorization. We apply these placement strategies and present performance results for a hybrid multicore/GPU LU algorithm as it is implemented in the public domain library MAGMA.
Type de document :
Rapport
[Research Report] RR-8497, INRIA. 2014
Liste complète des métadonnées

Littérature citée [23 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/hal-00957673
Contributeur : Marc Baboulin <>
Soumis le : lundi 10 mars 2014 - 18:30:52
Dernière modification le : jeudi 5 avril 2018 - 12:30:23
Document(s) archivé(s) le : mardi 10 juin 2014 - 12:50:42

Fichier

RR-8497.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-00957673, version 1

Collections

Citation

Adrien Rémy, Marc Baboulin, Masha Sosonkina, Brigitte Rozoy. Locality optimization on a NUMA architecture for hybrid LU factorization. [Research Report] RR-8497, INRIA. 2014. 〈hal-00957673〉

Partager

Métriques

Consultations de la notice

574

Téléchargements de fichiers

294