Symbolic Mapping and Allocation for the Cholesky Factorization on NUMA machines: Results and Optimizations

Emmanuel Jeannot 1, 2
1 RUNTIME - Efficient runtime systems for parallel architectures
Inria Bordeaux - Sud-Ouest, UB - Université de Bordeaux, CNRS - Centre National de la Recherche Scientifique : UMR5800
Abstract : We discuss some performance issues of the tiled Cholesky factorization on non-uniform memory access-time (NUMA) shared memory machines. We show how to optimize thread and data placement in order to achieve performance gains up to 50% compared to state-of- the-art libraries such as PLASMA or MKL.
Type de document :
Article dans une revue
International Journal of High Performance Computing Applications, SAGE Publications, 2013, 27 (3), pp.283--290
Liste complète des métadonnées

Littérature citée [7 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/hal-00921611
Contributeur : Emmanuel Jeannot <>
Soumis le : vendredi 20 décembre 2013 - 16:42:05
Dernière modification le : jeudi 11 janvier 2018 - 06:22:12
Document(s) archivé(s) le : vendredi 21 mars 2014 - 09:18:29

Fichier

jeannot.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-00921611, version 1

Citation

Emmanuel Jeannot. Symbolic Mapping and Allocation for the Cholesky Factorization on NUMA machines: Results and Optimizations. International Journal of High Performance Computing Applications, SAGE Publications, 2013, 27 (3), pp.283--290. 〈hal-00921611〉

Partager

Métriques

Consultations de la notice

351

Téléchargements de fichiers

157