A framework for efficient execution on GPU and CPU+GPU systems

Jean-François Dollinger 1
1 CAMUS - Compilation pour les Architectures MUlti-coeurS
Inria Nancy - Grand Est, ICube - Laboratoire des sciences de l'ingénieur, de l'informatique et de l'imagerie
Résumé : Les verrous technologiques rencontrés par les fabricants de semi-conducteurs au début des années deux-mille ont abrogé la flambée des performances des unités de calculs séquentielles. La tendance actuelle est à la multiplication du nombre de cœurs de processeur par socket et à l'utilisation progressive des cartes GPU pour des calculs hautement parallèles. La complexité des architectures récentes rend difficile l'estimation statique des performances d'un programme. Nous décrivons une méthode fiable et précise de prédiction du temps d'exécution de nids de boucles parallèles sur GPU basée sur trois étapes : la génération de code, le profilage offline et la prédiction online. En outre, nous présentons deux techniques pour exploiter l'ensemble des ressources disponibles d'un système pour la performance. La première consiste en l'utilisation conjointe des CPUs et GPUs pour l'exécution d'un code. Afin de préserver les performances il est nécessaire de considérer la répartition de charge, notamment en prédisant les temps d'exécution. Le runtime utilise les résultats du profilage et un ordonnanceur calcule des temps d'exécution et ajuste la charge distribuée aux processeurs. La seconde technique présentée met le CPU et le GPU en compétition : des instances du code cible sont exécutées simultanément sur CPU et GPU. Le vainqueur de la compétition notifie sa complétion à l'autre instance, impliquant son arrêt.
Type de document :
Thèse
Distributed, Parallel, and Cluster Computing [cs.DC]. Université de Strasbourg, 2015. English
Liste complète des métadonnées

Littérature citée [134 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/tel-01251719
Contributeur : Vincent Loechner <>
Soumis le : mercredi 6 janvier 2016 - 16:12:50
Dernière modification le : jeudi 29 mars 2018 - 09:10:05
Document(s) archivé(s) le : jeudi 7 avril 2016 - 16:07:46

Fichier

Identifiants

  • HAL Id : tel-01251719, version 1

Collections

Citation

Jean-François Dollinger. A framework for efficient execution on GPU and CPU+GPU systems. Distributed, Parallel, and Cluster Computing [cs.DC]. Université de Strasbourg, 2015. English. 〈tel-01251719〉

Partager

Métriques

Consultations de la notice

700

Téléchargements de fichiers

591