FT-GReLoSSS: a Skeletal-based approach towards application parallelization and low-overhead fault tolerance

Résumé : FT-GReLoSSS (FTG) est un framework C++/MPI pour faciliter le développement d'applications parallèles tolérantes aux pannes et appartenant à une famille d'algorithmes SPMD nommée GReLoSSS. L'originalité de FTG est de reposer sur les principes du modèle de programmation MoLOToF pour faciliter l'ajout d'une tolérance aux pannes de niveau applicatif fondée sur la réalisation de points de reprise (checkpointing). MoLOToF se caractérise d'une part par un développement structuré d'applications fondé sur des "squelettes" tolérants aux pannes, et d'autre part, par l'utilisation de collaborations. Ces dernières existent entre le programmeur, le framework et l'intergiciel d'exécution/environnement sous-jacents. Couplées à l'approche structurée, les collaborations contribuent à obtenir des tailles de points de reprise réduites ainsi que des surcoûts de checkpointing et de reprise réduits. Ce rapport introduit les principaux principes de MoLOToF ainsi que la conception du framework FTG. Pour évaluer la facilité d'utilisation du framework et l'efficacité de la tolérance aux pannes, une série de tests ont été menés jusqu'à 128 nœuds d'une grappe de PCs multi-cœurs. Ces tests impliquaient une application financière existante de valorisation d'actifs de stockage de gaz, initialement développée en collaboration avec EDF, et qui a été adaptée pour pouvoir profiter de FTG et de ses fonctionnalités. Les résultats expérimentaux témoignent de surcoûts faibles par rapport à des solutions équivalentes de niveau système.
Type de document :
Rapport
[Research Report] RR-7797, INRIA. 2011
Liste complète des métadonnées

Littérature citée [20 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/hal-00640558
Contributeur : Constantinos Makassikis <>
Soumis le : dimanche 13 novembre 2011 - 13:25:12
Dernière modification le : jeudi 5 avril 2018 - 12:30:11
Document(s) archivé(s) le : lundi 5 décembre 2016 - 00:19:33

Fichier

RR-7797.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-00640558, version 1

Citation

Constantinos Makassikis, Stéphane Vialle, Xavier Warin. FT-GReLoSSS: a Skeletal-based approach towards application parallelization and low-overhead fault tolerance. [Research Report] RR-7797, INRIA. 2011. 〈hal-00640558〉

Partager

Métriques

Consultations de la notice

592

Téléchargements de fichiers

133