An Experimental Environment for the Evaluation of Exascale HPC Runtimes - Inria - Institut national de recherche en sciences et technologies du numérique Accéder directement au contenu
Rapport (Rapport De Recherche) Année : 2014

An Experimental Environment for the Evaluation of Exascale HPC Runtimes

Joseph Emeras
  • Fonction : Auteur
  • PersonId : 911806
Lucas Nussbaum

Résumé

The era of Exascale computing raises new challenges for HPC. Intrinsic characteristics of those extreme scale platforms bring energy and reliability issues. To cope with those constraints, applications will have to be more flexible in order to deal with platform geometry evolutions and unavoidable failures. Thus, to prepare for this upcoming era, a strong effort must be made on improving the HPC software stack. This work focuses on improving the study of a central part of the software stack, the HPC runtimes. To this end we propose a tool that aims at evaluating such runtimes, at scale, to enable the discovery of performance gaps, understand future bottlenecks, and evaluate fault tolerance and load balancing mechanisms. Extensive experimentation showing the benefits of our approach has been performed with two HPC runtimes: Charm++ and OpenMPI.
L'arrivée des plates-formes Exascale pose de nouveaux problèmes pour le HPC. Les charactéristiques intrinsèques à ces plates-formes de taille extrême génèrent des problèmes de fiabilité ainsi que des problèmes énergétiques. Pour faire face à ces types de contraintes, les applications vont devoir devenir plus flexibles et s'adapter aux évolutions de la géométrie de la plate-forme ainsi qu'aux pannes, devenues inévitables. Ainsi, pour se préparer à l'Exascale, un effort important doit être fait dans le but d'améliorer la pile logicielle du HPC. Ce travail se concentre sur l'amélioration et l'évaluation d'un aspect central de la pile logicielle du HPC: le runtime. Dans ce but, nous proposons un outil permettant d'évaluer de tels runtimes, à grande échelle, afin d'aider à la découverte de problèmes de performance, d'appréhender les futurs goulots d'étranglement aisni que d'évaluer les mécanismes de tolérence aux fautes et d'équilibrage de charge. Une expérimentation conséquente nous a permis d'étayer nos propos et d'illustrer les bénéfices de notre approche sur deux types de runtime HPC: Charm++ et OpenMPI.
Fichier principal
Vignette du fichier
RR-8482.pdf (641.36 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-00949762 , version 1 (20-02-2014)
hal-00949762 , version 2 (10-01-2016)
hal-00949762 , version 3 (06-06-2016)

Identifiants

  • HAL Id : hal-00949762 , version 1

Citer

Joseph Emeras, Emmanuel Jeanvoine, Lucas Nussbaum. An Experimental Environment for the Evaluation of Exascale HPC Runtimes. [Research Report] RR-8482, INRIA. 2014. ⟨hal-00949762v1⟩

Collections

INRIA-RRRT
418 Consultations
382 Téléchargements

Partager

Gmail Facebook X LinkedIn More