Optimal Checkpointing Period: Time vs. Energy

Résumé : Dans ce court papier, nous considérons des applications scientifiques parallèles, utilisant des protocoles de sauvegarde de points de reprise (\emph{checkpoints}) coordonnés et périodiques afin de se préserver des fautes. Nous fournissons un modèle et des formules détaillées pour le temps total d'exécution et la consommation d'énergie de ces applications. Nous caractérisons pour les deux objectifs, les périodes optimales, et par de nombreuses simulations réalistes pour des systèmes exascales, montrons le compromis temps/énergie induit par ces périodes. Finalement, nous insistons particulièrement dans cette étude sur le coût des tranferts I/O : il est attendu que le coût relatif des communications augmente drastiquement, à la fois en termes de latence, et en termes énergétiques, pour les futures plateformes exascales.
Type de document :
Rapport
[Research Report] RR-8387, INRIA. 2013, pp.19
Liste complète des métadonnées

Littérature citée [16 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/hal-00878938
Contributeur : Equipe Roma <>
Soumis le : jeudi 31 octobre 2013 - 11:24:42
Dernière modification le : samedi 21 avril 2018 - 01:27:11
Document(s) archivé(s) le : samedi 1 février 2014 - 04:26:08

Fichier

RR-8387.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-00878938, version 1

Collections

Citation

Guillaume Aupy, Anne Benoit, Thomas Hérault, Yves Robert, Jack Dongarra. Optimal Checkpointing Period: Time vs. Energy. [Research Report] RR-8387, INRIA. 2013, pp.19. 〈hal-00878938〉

Partager

Métriques

Consultations de la notice

439

Téléchargements de fichiers

98