Un protocole de sauvegarde/reprise coordonné pour les applications à flot de données reconfigurables

Xavier Besseron 1 Laurent Pigeon 1 Thierry Gautier 1 Samir Jafar 1
1 MOAIS - PrograMming and scheduling design fOr Applications in Interactive Simulation
Inria Grenoble - Rhône-Alpes, LIG - Laboratoire d'Informatique de Grenoble
Résumé : La probabilité d'apparition d'une défaillance durant l'exécution d'une application parallèle de longue durée sur un grand nombre de processeurs est importante. Dans cet article, nous considérons l'étude d'un nouveau protocole de sauvegarde/reprise basé sur la construction coordonnée d'un état global cohérent, et dont la reprise après défaillance d'un processus ne nécessite qu'un redémarrage partiel de certains autres processus. Ce protocole repose sur l'existence d'une représentation abstraite de l'exécution.
Document type :
Journal articles
Complete list of metadatas

https://hal.inria.fr/hal-00691989
Contributor : Ist Rennes <>
Submitted on : Friday, April 27, 2012 - 3:53:18 PM
Last modification on : Thursday, October 11, 2018 - 8:48:03 AM

Links full text

Identifiers

Collections

Citation

Xavier Besseron, Laurent Pigeon, Thierry Gautier, Samir Jafar. Un protocole de sauvegarde/reprise coordonné pour les applications à flot de données reconfigurables. Technique et Science Informatiques, Hermès-Lavoisier, 2008, 27 (3-4), pp.395-425. ⟨10.3166/tsi.27.395-425⟩. ⟨hal-00691989⟩

Share

Metrics

Record views

312