Road to exascale: Improving scheduling performances and reducing energy consumption with the help of end-users

David Glesser 1, 2, 3, 4
2 MOAIS - PrograMming and scheduling design fOr Applications in Interactive Simulation
Inria Grenoble - Rhône-Alpes, LIG - Laboratoire d'Informatique de Grenoble
4 DATAMOVE - Data Aware Large Scale Computing
Inria Grenoble - Rhône-Alpes, LIG - Laboratoire d'Informatique de Grenoble
Résumé : Le domaine du calcul haute performance (i.e. la science des super-calculateurs) est caractérisé par l’évolution continuelle des architectures de calcul, la prolifération des ressources de calcul et la complexité croissante des problèmes que les utilisateurs veulent résoudre. Un des logiciels les plus importants de la pile logicielle des supercalculateurs est le Système de Gestion des Ressources et des Tâches. Il est le lien entre la charge de travail donnée par les utilisateurs et la plateforme de calcul. Ce type de logiciels spécialisés fournit des fonctions pour construire, soumettre, planifier et surveiller les tâches dans un environnent de calcul complexe et dynamique. Pour pouvoir atteindre des supercalculateurs exaflopiques, de nouvelles contraintes et objectifs ont été inventés. Cette thèse développe et teste l’idée que les utilisateurs de ces systèmes peuvent aider à atteindre l’échelle exaflopique. Spé- cifiquement, nous montrons des techniques qui utilisent les comportements des utilisateurs pour améliorer la consommation énergétique et les performances glob- ales des supercalculateurs. Pour tester ces nouvelles techniques, nous avons besoin de nouveaux outils et méthodes qui sont capables d’aller jusqu’à l’échelle exaflopique. Nous proposons donc des outils qui permettent de tester de nouveaux algorithmes capables de s’exécuter sur ces systèmes. Ces outils sont capables de fonctionner sur de petits supercalculateurs en émulant ou simulant des systèmes plus puissants. Après avoir évalué différentes techniques pour mesurer l’énergie dans les supercalculateurs, nous proposons une nouvelle heuristique, basée sur un algorithme répandu (Easy Backfilling), pour pouvoir contrôler la puissance électrique de ces énormes systèmes. Nous montrons aussi comment, en utilisant la même méthode, contrôler la consommation énergétique pendant une période de temps. Le mécanisme proposé peut limiter la consommation énergétique tout en gardant des performances satisfaisantes. Si l’énergie est une ressource limitée, il faut la partager équitablement. Nous présentons de plus un mécanisme permettant de partager la consommation énergétique entre les utilisateurs. Nous soutenons que cette méthode va motiver les utilisateurs à réduire la consommation énergétique de leurs calculs. Finalement, nous analysons le comportement actuel et passé des utilisateurs pour améliorer les performances des supercalculateurs. Cette approche non seulement surpasse les performances des travaux existants, mais aussi ouvre la voie à l’utilisation de méthodes semblables dans d’autres aspects des Systèmes de Gestion des Ressources et des Tâches.
Type de document :
Thèse
Distributed, Parallel, and Cluster Computing [cs.DC]. Univ. Grenoble Alpes, 2016. English
Liste complète des métadonnées

https://hal.inria.fr/tel-01425620
Contributeur : Grégory Mounié <>
Soumis le : mardi 3 janvier 2017 - 16:48:08
Dernière modification le : mercredi 11 avril 2018 - 01:55:41
Document(s) archivé(s) le : mardi 4 avril 2017 - 14:42:36

Identifiants

  • HAL Id : tel-01425620, version 1

Citation

David Glesser. Road to exascale: Improving scheduling performances and reducing energy consumption with the help of end-users. Distributed, Parallel, and Cluster Computing [cs.DC]. Univ. Grenoble Alpes, 2016. English. 〈tel-01425620〉

Partager

Métriques

Consultations de la notice

526

Téléchargements de fichiers

222