Towards Optimal Multi-Level Checkpointing

Résumé : Ce travail analyse les techniques de checkpoint multi-niveaux. On étudie les schémas de calcul périodiques, où les différents niveaux de checkpoint sont imbriqués, et on caractérise le schéma optimal, i.e., celui dont le surcoût par unité de calcul est minimal. On montre que ce surcoût minimal est de l'ordre de $\sum_{\ell=1}^{k}\sqrt{2\lambda_\ell C_\ell}$, où $\lambda_\ell$ est le taux d'erreur au niveau~$\ell$, et $C_\ell$ le coût de checkpoint au niveau~$\ell$. Cette formule étend la célèbre formule de Young/Daly pour un seul niveau. On propose également un algorithme de programmation dynamique pour déterminer le meilleur sous-ensemble de niveuax à utiliser pour minimiser le surcoût global. Enfin, nous conduisons des simulations pour vérifier l'étude théorique, et confirmer l'optimalité du sous-ensemble déterminé par l'algorithme de programmation dynamique. Les résultats corroborent bien l'étude théorique, et montrent toute l'utilité d'une approche multi-niveaux basée sur le sous-ensemble de niveaux optimal.
Type de document :
Rapport
[Research Report] RR-8930, INRIA Grenoble - Rhone-Alpes. 2016
Liste complète des métadonnées

Littérature citée [17 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/hal-01339788
Contributeur : Equipe Roma <>
Soumis le : lundi 19 décembre 2016 - 12:40:36
Dernière modification le : mercredi 9 mai 2018 - 15:11:39

Fichier

RR-8930.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-01339788, version 3

Collections

Citation

Anne Benoit, Aurélien Cavelan, Valentin Le Fèvre, Yves Robert, Hongyang Sun. Towards Optimal Multi-Level Checkpointing. [Research Report] RR-8930, INRIA Grenoble - Rhone-Alpes. 2016. 〈hal-01339788v3〉

Partager

Métriques

Consultations de la notice

165

Téléchargements de fichiers

116