Dynamic Placement of Progress Thread for Overlapping MPI Non-Blocking Collectives on Manycore Processor

Résumé : Les collectives MPI non-bloquantes ont été proposées pour recouvrir les communications par du calcul afin d’en amortir le coût. Cependant, ces opérations consomment plus de temps CPUque les opérations point-à-point. L’utilisation d’un seul CPU dédié aux threads de progression n’est donc pas efficace et rend les communications lentes. D’un autre côté, si les communications sont exécutées sur les coeurs applicatifs, aucun recouvrement n’est obtenu. Pour aborder ce problème, nous proposons un algorithme pour les opérations collectives en arbre qui scinde l’arbre des communications entre les coeurs applicatifs et les coeurs dédiés aux communications afin d’obtenir un compromis entre le taux de recouvrement et les performances globales. Nous proposons un modèle afin d’étudier et prédire son comportement puis l’avons implémenté dans le framework MPC. Nous avons obtenu de bons résultats en testant notre approche sur des processeurs manycores tels que le KNL et le Skylake.
Type de document :
Rapport
[Research Report] RR-9160, Inria Bordeaux Sud-Ouest. 2018, pp.1-12
Liste complète des métadonnées

Littérature citée [16 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/hal-01741787
Contributeur : Alexandre Denis <>
Soumis le : lundi 26 mars 2018 - 13:25:01
Dernière modification le : lundi 15 octobre 2018 - 15:54:03

Fichier

RR-9160.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-01741787, version 2

Citation

Alexandre Denis, Julien Jaeger, Emmanuel Jeannot, Marc Pérache, Hugo Taboada. Dynamic Placement of Progress Thread for Overlapping MPI Non-Blocking Collectives on Manycore Processor. [Research Report] RR-9160, Inria Bordeaux Sud-Ouest. 2018, pp.1-12. 〈hal-01741787v2〉

Partager

Métriques

Consultations de la notice

148

Téléchargements de fichiers

159