Optimal checkpointing period with replicated execution on heterogeneous platforms

Résumé : Ce rapport propose un modèle et une étude analytique de deux stratégies de réplication, combinée avec des prises de checkpoint, sur plates-formes hétérogènes. L'application s'exécute sur deux plates-formes de vitesses et taux de fautes différents, et qui partagent un espace de stockage stable. Nous déterminons la taille optimale du travail $W$ pour une stratégie périodique où les deux plates-formes tentent d'exécuter $W$ unités de travail avant de prendre un checkpoint. La première plate-forme qui réussit prend ce checkpoint, et l'autre s'interrompt et se resynchronise avec la première à partir du checkpoint. Nous comparons cette stratégie avec une stratégie plus simple, dite de checkpoint-sur-faute, où un checkpoint n'est pris sur une plate-forme que quand l'autre est sujette à une faute. Nous calculons des approximations du premier et deuxième ordre pour la taille optimale W, et montrons par simulationque celles-ci sont très précises. Les simulations montrent l'utilité d'une seconde plate-forme, même lorsqu'elle a une vitesse relativement différente, puisqu'on gagne 30% en moyenne. En- n, la stratégie périodique est la plus efficace globalement, sauf si les deux plates-formes sont des vitesses très proches.
Type de document :
Rapport
[Research Report] RR-9055, INRIA. 2017
Liste complète des métadonnées

https://hal.inria.fr/hal-01504936
Contributeur : Equipe Roma <>
Soumis le : lundi 10 avril 2017 - 16:33:44
Dernière modification le : mardi 16 janvier 2018 - 15:30:11
Document(s) archivé(s) le : mardi 11 juillet 2017 - 14:28:23

Fichier

rr9055inria.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-01504936, version 1

Collections

Citation

Anne Benoit, Aurélien Cavelan, Valentin Le Fèvre, Yves Robert. Optimal checkpointing period with replicated execution on heterogeneous platforms. [Research Report] RR-9055, INRIA. 2017. 〈hal-01504936〉

Partager

Métriques

Consultations de la notice

177

Téléchargements de fichiers

33