Performance Analysis and Optimization of the Tiled Cholesky Factorization on NUMA Machines

Emmanuel Jeannot 1, 2
1 RUNTIME - Efficient runtime systems for parallel architectures
Inria Bordeaux - Sud-Ouest, UB - Université de Bordeaux, CNRS - Centre National de la Recherche Scientifique : UMR5800
Abstract : We discuss some performance issues of the tiled Cholesky factorization on non-uniform memory access-time (NUMA) shared memory machines. We show how to optimize thread placement and data placement in order to achieve performance gain up to 50% compared to state-of-the-art libraries such as Plasma or MKL.
Type de document :
Communication dans un congrès
PAAP 2012 - IEEE International Symposium on Parallel Architectures, Algorithms and Programming, Dec 2012, Taipei, Taiwan. IEEE, 2012
Liste complète des métadonnées

Littérature citée [10 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/hal-00772790
Contributeur : Emmanuel Jeannot <>
Soumis le : vendredi 11 janvier 2013 - 10:37:21
Dernière modification le : jeudi 11 janvier 2018 - 06:22:12
Document(s) archivé(s) le : samedi 1 avril 2017 - 03:46:31

Fichier

jeannot.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-00772790, version 1

Collections

Citation

Emmanuel Jeannot. Performance Analysis and Optimization of the Tiled Cholesky Factorization on NUMA Machines. PAAP 2012 - IEEE International Symposium on Parallel Architectures, Algorithms and Programming, Dec 2012, Taipei, Taiwan. IEEE, 2012. 〈hal-00772790〉

Partager

Métriques

Consultations de la notice

222

Téléchargements de fichiers

119