Un protocole de sauvegarde/reprise coordonné pour les applications à flot de données reconfigurables

Xavier Besseron 1 Laurent Pigeon 1 Thierry Gautier 1 Samir Jafar 1
1 MOAIS - PrograMming and scheduling design fOr Applications in Interactive Simulation
ID-IMAG - Informatique et Distribution, Inria Grenoble - Rhône-Alpes, UJF - Université Joseph Fourier - Grenoble 1
Résumé : La probabilité d'apparition d'une défaillance durant l'exécution d'une application parallèle de longue durée sur un grand nombre de processeurs est importante. Dans cet article, nous considérons l'étude d'un nouveau protocole de sauvegarde/reprise basé sur la construction coordonnée d'un état global cohérent, et dont la reprise après défaillance d'un processus ne nécessite qu'un redémarrage partiel de certains autres processus. Ce protocole repose sur l'existence d'une représentation abstraite de l'exécution.
Document type :
Conference papers
Complete list of metadatas

https://hal.inria.fr/hal-00695246
Contributor : Ist Rennes <>
Submitted on : Monday, May 7, 2012 - 3:45:38 PM
Last modification on : Wednesday, April 11, 2018 - 1:56:29 AM

Identifiers

  • HAL Id : hal-00695246, version 1

Collections

Citation

Xavier Besseron, Laurent Pigeon, Thierry Gautier, Samir Jafar. Un protocole de sauvegarde/reprise coordonné pour les applications à flot de données reconfigurables. RenPar'17 : 17ème Rencontres Francophones du Parallélisme, Oct 2006, Canet en Roussillon, France. ⟨hal-00695246⟩

Share

Metrics

Record views

229