Un protocole de sauvegarde/reprise coordonné pour les applications à flot de données reconfigurables

Xavier Besseron 1 Laurent Pigeon 1 Thierry Gautier 1 Samir Jafar 1
1 MOAIS - PrograMming and scheduling design fOr Applications in Interactive Simulation
Inria Grenoble - Rhône-Alpes, LIG - Laboratoire d'Informatique de Grenoble
Résumé : La probabilité d'apparition d'une défaillance durant l'exécution d'une application parallèle de longue durée sur un grand nombre de processeurs est importante. Dans cet article, nous considérons l'étude d'un nouveau protocole de sauvegarde/reprise basé sur la construction coordonnée d'un état global cohérent, et dont la reprise après défaillance d'un processus ne nécessite qu'un redémarrage partiel de certains autres processus. Ce protocole repose sur l'existence d'une représentation abstraite de l'exécution.
Type de document :
Article dans une revue
Technique et Science Informatiques, Hermès-Lavoisier, 2008, 27 (3-4), pp.395-425. 〈10.3166/tsi.27.395-425〉
Liste complète des métadonnées

https://hal.inria.fr/hal-00691989
Contributeur : Ist Rennes <>
Soumis le : vendredi 27 avril 2012 - 15:53:18
Dernière modification le : jeudi 11 octobre 2018 - 08:48:03

Identifiants

Collections

Citation

Xavier Besseron, Laurent Pigeon, Thierry Gautier, Samir Jafar. Un protocole de sauvegarde/reprise coordonné pour les applications à flot de données reconfigurables. Technique et Science Informatiques, Hermès-Lavoisier, 2008, 27 (3-4), pp.395-425. 〈10.3166/tsi.27.395-425〉. 〈hal-00691989〉

Partager

Métriques

Consultations de la notice

252