Task-based Conjugate-Gradient for multi-GPUs platforms

Résumé : andis que la plupart des logiciels de calcul haute performance (HPC) actuels sont des codes extrêmement optimisés en prenant en compte les détails de bas-niveau, l'avènement de l'ère manycore incite la communauté à considèrer des paradigmes de programmation mod- ulaires et ainsi déléguer une partie du travail à des librairies tierces. Cette dernière approche s'est avérée très productive et efficace dans le cas d'algorithmes réguliers, tels que ceux issus de l'algèbre linéaire dense. Dans ce papier, nous démontrons qu'un tel modèle peut être effi- cacement appliqué à un problème beaucoup plus irrégulier et moins intensif en calcul. Nous illustrons notre discussion avec l'algorithme standard du Gradient Conjugué (CG) non précon- ditionné que nous exprimons sous la forme d'un algorithme en graphe de tâches. Nous utilisons le moteur d'exécution StarPU pour évaluer l'efficacité de notre approche sur une plate-forme de calcul composée de trois accélérateurs graphiques (GPU) NVIDIA Fermi. Nous démontrons qu'une accroissement de performance (jusqu'à un facteur 2, 89) quasi optimal (relativement au cas mono-GPU) peut être atteinte lorsque sont traitées des matrices creuses de grande taille. Nous montrons de surcroît que la performance est portable quand les mécanismes de transfert mémoire bas-niveau sont changés.
Type de document :
Rapport
[Research Report] RR-8192, INRIA. 2012, pp.28
Liste complète des métadonnées


https://hal.inria.fr/hal-00767368
Contributeur : Stojce Nakov <>
Soumis le : mercredi 19 décembre 2012 - 17:13:10
Dernière modification le : samedi 17 septembre 2016 - 01:36:50
Document(s) archivé(s) le : mercredi 20 mars 2013 - 11:33:51

Fichier

RR-8192.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-00767368, version 1

Collections

Citation

Emmanuel Agullo, Luc Giraud, Abdou Guermouche, Stojce Nakov, Jean Roman. Task-based Conjugate-Gradient for multi-GPUs platforms. [Research Report] RR-8192, INRIA. 2012, pp.28. <hal-00767368>

Partager

Métriques

Consultations de
la notice

447

Téléchargements du document

413