Skip to Main content Skip to Navigation
Reports

Dynamic Placement of Progress Thread for Overlapping MPI Non-Blocking Collectives on Manycore Processor

Résumé : Les collectives MPI non-bloquantes ont été proposées pour recouvrir les communications par du calcul afin d’en amortir le coût. Cependant, ces opérations consomment plus de temps CPUque les opérations point-à-point. L’utilisation d’un seul CPU dédié aux threads de progression n’est donc pas efficace et rend les communications lentes. D’un autre côté, si les communications sont exécutées sur les coeurs applicatifs, aucun recouvrement n’est obtenu. Pour aborder ce problème, nous proposons un algorithme pour les opérations collectives en arbre qui scinde l’arbre des communications entre les coeurs applicatifs et les coeurs dédiés aux communications afin d’obtenir un compromis entre le taux de recouvrement et les performances globales. Nous proposons un modèle afin d’étudier et prédire son comportement puis l’avons implémenté dans le framework MPC. Nous avons obtenu de bons résultats en testant notre approche sur des processeurs manycores tels que le KNL et le Skylake.
Complete list of metadatas

Cited literature [16 references]  Display  Hide  Download

https://hal.inria.fr/hal-01741787
Contributor : Alexandre Denis <>
Submitted on : Monday, March 26, 2018 - 1:25:01 PM
Last modification on : Monday, December 9, 2019 - 3:56:02 PM

File

RR-9160.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : hal-01741787, version 2

Collections

Citation

Alexandre Denis, Julien Jaeger, Emmanuel Jeannot, Marc Pérache, Hugo Taboada. Dynamic Placement of Progress Thread for Overlapping MPI Non-Blocking Collectives on Manycore Processor. [Research Report] RR-9160, Inria Bordeaux Sud-Ouest. 2018, pp.1-12. ⟨hal-01741787v2⟩

Share

Metrics

Record views

246

Files downloads

608