Implementing a Systolic Algorithm for QR Factorization on Multicore Clusters with PaRSEC

Résumé : Cet article présente un nouvel algorithme systolique pour la factorisation QR, ainsi que son implémentation sur un cluster de noeuds multicoeurs. L'algorithme a été conçu pour un tore-3D virtuel et ne demande que des communications locales. L'implémentation de cet algorithme utilise des threads au niveau des noeuds, ainsi que MPI pour les communication inter-noeuds. La complexité de l'implémentation a été maîtrisée grâce à l'utilisation du logiciel PaRSEC, qui prend en entrée un graphe de dépendances paramétrisé, dérivé de l'algorithme, et ne laisse à l'utilisateur que le choix de l'allocation haut-niveau des tâches aux noeuds. Le nouvel algorithme s'avère aussi efficace que des routines QR à la pointe de l'art sur le super-ordinateur Kraken, montrant ainsi que l'environnement PaRSEC est une excellente alternative pour accroître la production de logiciels de qualité sur des architectures complexes et hiérarchiques.
Type de document :
Rapport
[Research Report] RR-8390, INRIA. 2013, pp.16
Liste complète des métadonnées

Littérature citée [23 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/hal-00879248
Contributeur : Guillaume Aupy <>
Soumis le : samedi 2 novembre 2013 - 11:20:28
Dernière modification le : samedi 21 avril 2018 - 01:27:08
Document(s) archivé(s) le : lundi 3 février 2014 - 04:24:22

Fichier

RR-8390.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-00879248, version 1

Collections

Citation

Guillaume Aupy, Mathieu Faverge, Yves Robert, Jakub Kurzak, Piotr Luszczek, et al.. Implementing a Systolic Algorithm for QR Factorization on Multicore Clusters with PaRSEC. [Research Report] RR-8390, INRIA. 2013, pp.16. 〈hal-00879248〉

Partager

Métriques

Consultations de la notice

395

Téléchargements de fichiers

193