Comments on ''Improving the computing efficiency of HPC systems using a combination of proactive and preventive checkpoint'' - Inria - Institut national de recherche en sciences et technologies du numérique Accéder directement au contenu
Rapport (Rapport De Recherche) Année : 2013

Comments on ''Improving the computing efficiency of HPC systems using a combination of proactive and preventive checkpoint''

Résumé

In this short note, we provide some comments on the recent paper ''Improving the computing efficiency of HPC systems using a combination of proactive and preventive checkpointing'' by Bouguerra et al.. We start by identifying some errors in their equations. Then we explain that they do not actually use the distribution of lead times, contrary to statements by the authors. Finally, we show that their algorithm does not change policy at the best possible moment, and we point to our own work~\cite{rr-journal-prediction} for the (correct version of the) optimal algorithm.
Dans cette courte note nous commentons l'article ''Improving the computing efficiency of HPC systems using a combination of proactive and preventive checkpointing'' de Bouguerra et al.~\cite{SlimIPDPS13}. Nous commençons par identifier des erreurs dans la mise en équation du problème. Nous expliquons ensuite que, contrairement à ce qu'ils prétendent, les auteurs n'utilisent pas la distribution du délai de prédiction (\emph{lead time}). Finalement, nous montrons que leur algorithme ne change pas de politique au moment optimum, et nous indiquons que nous avons présenté l'algorithme optimal dans un précédent rapport de recherche.
Fichier principal
Vignette du fichier
RR-8318.pdf (623.76 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-00836629 , version 1 (21-06-2013)

Identifiants

  • HAL Id : hal-00836629 , version 1

Citer

Guillaume Aupy, Yves Robert, Frédéric Vivien, Dounia Zaidouni. Comments on ''Improving the computing efficiency of HPC systems using a combination of proactive and preventive checkpoint''. [Research Report] RR-8318, INRIA. 2013. ⟨hal-00836629⟩
111 Consultations
233 Téléchargements

Partager

Gmail Facebook X LinkedIn More