Skip to Main content Skip to Navigation
Reports

Conception et évaluation d'un protocole de reprise d'applications paralèlles dans une fédération de grappes de calculateurs

Sébastien Monnet 1
1 PARIS - Programming distributed parallel systems for large scale numerical simulation
IRISA - Institut de Recherche en Informatique et Systèmes Aléatoires, ENS Cachan - École normale supérieure - Cachan, Inria Rennes – Bretagne Atlantique
Résumé : Ce document présente le compte-rendu d'une étude sur la reprise d'applications parallèles dans les fédérations de grappes de calculateurs. Les protocoles de l'état de l'art ne passent pas à l'échelle. Ce doccument décrit un protocole hiérarchique de points de reprise / recouvrement arrière qui combine une technique de points de reprise coordonnés au sein d'une grappe et une technique de points de reprise induits par les communications entre les grappes. En premier lieu, il présente un aperçu des techniques de reprises d'applications parallèles existantes ainsi qu'une discussion sur ces dernières. Ensuite, une réflexion sur la prise en compte de l'architecture particulière des fédérations de grappes de calculateurs est menée. Cette réflexion aboutie à la proposition d'un protocole de tolérance aux défaillances adapté. Ce protocole est présenté et analysé au travers d'exemples. Une étude des performances du protocole proposé est menée à l'aide d'un simulateur à évènements discrets.
Complete list of metadata

https://hal.inria.fr/inria-00001039
Contributor : Sébastien Monnet <>
Submitted on : Wednesday, January 18, 2006 - 11:26:44 AM
Last modification on : Monday, February 15, 2021 - 10:38:19 AM
Long-term archiving on: : Saturday, April 3, 2010 - 9:30:44 PM

Identifiers

  • HAL Id : inria-00001039, version 1

Citation

Sébastien Monnet. Conception et évaluation d'un protocole de reprise d'applications paralèlles dans une fédération de grappes de calculateurs. [Stage] 2003, pp.66. ⟨inria-00001039⟩

Share

Metrics

Record views

267

Files downloads

90