When Amdahl Meets Young/Daly

Résumé : Cet article étudie le nombre optimal de processeurs pour exécuter un travail parallèle dont le profil d'accélération obéit à la loi d'Amdahl, sur une plateforme à grande échelle exposée aux pannes et aux erreurs silencieuses. Nous combinons l'approche traditionnelle de checkpointing/recovery avec des mécanismes de vérification pour faire face aux deux types d'erreurs. Nous fournissons une formule exacte pour mesurer le surcoût du temps d'exécution induit par un motif de checkpoint périodique de longueur $T$ et avec $P$ processeurs, et nous donnons une approximation au premier ordre des valeurs optimales de $T^{*}$ et $P^{*}$ en fonction du taux d'erreur individuel d'un processeur $\lambda_{\mathrm{ind}}$ Un résultat frappant est que $P^{*}$ est de l'ordre de $\lambda_{\mathrm{ind}}^{-1/4}$ quand le coût de checkpoint croît linéairement avec le nombre de processeurs, et de l'ordre de $\lambda_{\mathrm{ind}}^{-1/3}$ quand le coût de checkpoint reste borné par $P$. Nous menons une large campagne de simulations pour appuyer l'étude théorique. Les résultats confirmes la précision de l'approximation au premier ordre pour une large gamme de paramètres.
Type de document :
Rapport
[Research Report] RR-8871, ENS Lyon, CNRS & INRIA. 2016
Liste complète des métadonnées

Littérature citée [38 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/hal-01280004
Contributeur : Equipe Roma <>
Soumis le : mercredi 6 juillet 2016 - 17:46:13
Dernière modification le : vendredi 20 avril 2018 - 15:44:27

Fichier

RR-8871_update.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-01280004, version 4

Collections

Citation

Aurélien Cavelan, Jiafan Li, Yves Robert, Hongyang Sun. When Amdahl Meets Young/Daly. [Research Report] RR-8871, ENS Lyon, CNRS & INRIA. 2016. 〈hal-01280004v4〉

Partager

Métriques

Consultations de la notice

150

Téléchargements de fichiers

111