Checkpointing algorithms and fault prediction

Guillaume Aupy 1, 2, * Yves Robert 1, 2 Frédéric Vivien 1, 2 Dounia Zaidouni 1, 2
* Auteur correspondant
2 ROMA - Optimisation des ressources : modèles, algorithmes et ordonnancement
Inria Grenoble - Rhône-Alpes, LIP - Laboratoire de l'Informatique du Parallélisme
Résumé : Ce travail considère l'impact des techniques de prédiction de fautes sur les stratégies de protocoles de sauvegarde de points de reprise (\emph{checkpoints}) et de redémarrage. Nous étendons l'analyse classique de Young en présence d'un système de prédiction de fautes, qui est caractérisé par son rappel (taux de pannes prévues sur nombre total de pannes) et par sa précision (taux de vraies pannes parmi le nombre total de pannes annoncées). Dans ce travail, nous avons pu obtenir la valeur optimale de la période de checkpoint (minimisant ainsi le gaspillage de l'utilisation des ressources dû au coût de prise de ces points de sauvegarde) dans différents scénarios. Ce papier pose les fondations théoriques pour de futures expériences et une validation du modèle.
Type de document :
Rapport
[Research Report] RR-8237, INRIA. 2013, pp.8237
Liste complète des métadonnées

Littérature citée [26 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/hal-00788313
Contributeur : Guillaume Aupy <>
Soumis le : vendredi 1 novembre 2013 - 20:13:13
Dernière modification le : samedi 21 avril 2018 - 01:27:14
Document(s) archivé(s) le : vendredi 7 avril 2017 - 20:02:18

Fichier

RR-8237.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-00788313, version 2

Collections

Citation

Guillaume Aupy, Yves Robert, Frédéric Vivien, Dounia Zaidouni. Checkpointing algorithms and fault prediction. [Research Report] RR-8237, INRIA. 2013, pp.8237. 〈hal-00788313v2〉

Partager

Métriques

Consultations de la notice

474

Téléchargements de fichiers

164