Un protocole de sauvegarde/reprise coordonné pour les applications à flot de données reconfigurables

Xavier Besseron 1 Laurent Pigeon 1 Thierry Gautier 1 Samir Jafar 1
1 MOAIS - PrograMming and scheduling design fOr Applications in Interactive Simulation
ID-IMAG - Informatique et Distribution, Inria Grenoble - Rhône-Alpes, UJF - Université Joseph Fourier - Grenoble 1
Résumé : La probabilité d'apparition d'une défaillance durant l'exécution d'une application parallèle de longue durée sur un grand nombre de processeurs est importante. Dans cet article, nous considérons l'étude d'un nouveau protocole de sauvegarde/reprise basé sur la construction coordonnée d'un état global cohérent, et dont la reprise après défaillance d'un processus ne nécessite qu'un redémarrage partiel de certains autres processus. Ce protocole repose sur l'existence d'une représentation abstraite de l'exécution.
Type de document :
Communication dans un congrès
RenPar'17 : 17ème Rencontres Francophones du Parallélisme, Oct 2006, Canet en Roussillon, France. 2006
Liste complète des métadonnées

https://hal.inria.fr/hal-00695246
Contributeur : Ist Rennes <>
Soumis le : lundi 7 mai 2012 - 15:45:38
Dernière modification le : mercredi 11 avril 2018 - 01:56:29

Identifiants

  • HAL Id : hal-00695246, version 1

Collections

Citation

Xavier Besseron, Laurent Pigeon, Thierry Gautier, Samir Jafar. Un protocole de sauvegarde/reprise coordonné pour les applications à flot de données reconfigurables. RenPar'17 : 17ème Rencontres Francophones du Parallélisme, Oct 2006, Canet en Roussillon, France. 2006. 〈hal-00695246〉

Partager

Métriques

Consultations de la notice

178