Checkpointing strategies with prediction windows - Inria - Institut national de recherche en sciences et technologies du numérique Accéder directement au contenu
Rapport (Rapport De Recherche) Année : 2013

Checkpointing strategies with prediction windows

Résumé

This paper deals with the impact of fault prediction techniques on checkpointing strategies. We suppose that the fault-prediction system provides prediction windows instead of exact predictions, which dramatically complicates the analysis of the checkpointing strategies. We propose a new approach based upon two periodic modes, a regular mode outside prediction windows, and a proactive mode inside prediction windows, whenever the size of these windows is large enough. We are able to compute the best period for any size of the prediction windows, thereby deriving the scheduling strategy that minimizes platform waste. In addition, the results of this analytical evaluation are nicely corroborated by a comprehensive set of simulations, which demonstrate the validity of the model and the accuracy of the approach.
Ce travail considère l'impact des techniques de prédiction de fautes sur les stratégies de protocoles de sauvegarde de points de reprise (\emph{checkpoints}) et de redémarrage. Nous supposons que le système de prédiction de faute fournit, en plus de ses caractéristiques, rappel (taux de pannes prévues sur nombre total de pannes) et précision (taux de vraies pannes parmi le nombre total de pannes annoncées), des intervalles dans lesquels les fautes risquent d'arriver plutôt qu'une date exacte, ce qui complique énormément l'analyse des stratégies de checkpoint. Nous proposons une nouvelle approche qui se base sur deux modes périodiques, le mode régulier (en dehors des fenêtres de prédiction), et le mode proactif (à l'intérieur des fenêtres de prédiction), quand ces fenêtres sont suffisamment larges. Nous sommes capables de calculer la période optimale pour n'importe quelle taille de fenêtre de prédiction, dérivant ainsi la stratégie d'ordonnancement optimale pour minimiser les pertes. Enfin, ces résultats théoriques sont corroborés par un ensemble complet de simulations, ce qui démontre la validité du modèle et la précision de notre approche.
Fichier principal
Vignette du fichier
RR-8239.pdf (1.8 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-00789109 , version 1 (15-02-2013)

Identifiants

  • HAL Id : hal-00789109 , version 1

Citer

Guillaume Aupy, Yves Robert, Frédéric Vivien, Dounia Zaidouni. Checkpointing strategies with prediction windows. [Research Report] RR-8239, INRIA. 2013, pp.44. ⟨hal-00789109⟩
124 Consultations
159 Téléchargements

Partager

Gmail Facebook X LinkedIn More