Achieving High Performance on Supercomputers with a Sequential Task-based Programming Model

Emmanuel Agullo 1 Olivier Aumage 2 Mathieu Faverge 3, 1 Nathalie Furmento 4, 5 Florent Pruvost 1 Marc Sergent 2, 5, 6, 7 Samuel Thibault 7, 2, 5
1 HiePACS - High-End Parallel Algorithms for Challenging Numerical Simulations
LaBRI - Laboratoire Bordelais de Recherche en Informatique, Inria Bordeaux - Sud-Ouest
2 STORM - STatic Optimizations, Runtime Methods
LaBRI - Laboratoire Bordelais de Recherche en Informatique, Inria Bordeaux - Sud-Ouest
6 CEA/CESTA
CESTA - Centre d'études scientifiques et techniques d'Aquitaine
Résumé : L’émergence d’accélérateurs comme ressources de calcul standard sur les supercalculateurs et la complexification associée des architectures ressuscite le besoin de paradigmes de programmation de haut niveau. La programmation par tâches séquentielle a montré qu’elle pouvait efficacement répondre à ce besoin sur un seul nœud de calcul multicœur possiblement dotée d’accélérateurs, ce qui a motivé son intégration dans le standard OpenMP 4.0. Dans ce papier, nous montrons que ce paradigme peut également être utilisé pour obtenir de hautes performances sur les supercalculateurs modernes composés de plusieurs de ces nœuds de calcul, tout en limitant à au maximum les changements dans le code utilisateur. Afin de prouver cette affirmation, nous avons ajouté au support d’exécution StarPU une couche avancée de gestion des données inter-nœuds qui supporte ce modèle en émettant automatiquement les communications. Nous illustrons notre discussion avec une factorisation de Cholesky tuilée en tâches que nous avons implémentée sur cette nouvelle couche de support exécutif. Nous montrons que cette méthode permet une grande productivité tout en permettant d’obtenir des performances compétitives tant avec l’implémentation de référence ScaLAPACK de Cholesky, qui est basée purement sur l’Interface de Passage de Message (MPI), qu’avec le code Cholesky de DPLASMA, qui implémente un autre modèle de programmation par tâches (non séquentiel).
Type de document :
Rapport
[Research Report] RR-8927, Inria Bordeaux Sud-Ouest; Bordeaux INP; CNRS; Université de Bordeaux; CEA. 2016, pp.27
Liste complète des métadonnées


https://hal.inria.fr/hal-01332774
Contributeur : Marc Sergent <>
Soumis le : jeudi 16 juin 2016 - 14:43:01
Dernière modification le : vendredi 16 septembre 2016 - 15:13:45

Fichier

RR-8927.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-01332774, version 1

Collections

Citation

Emmanuel Agullo, Olivier Aumage, Mathieu Faverge, Nathalie Furmento, Florent Pruvost, et al.. Achieving High Performance on Supercomputers with a Sequential Task-based Programming Model. [Research Report] RR-8927, Inria Bordeaux Sud-Ouest; Bordeaux INP; CNRS; Université de Bordeaux; CEA. 2016, pp.27. <hal-01332774>

Partager

Métriques

Consultations de
la notice

602

Téléchargements du document

401