Task-based FMM for heterogeneous architectures

Résumé : Développer une méthode des Multipôles Rapide (FMM) à haute performance est cruciale pour des simulations numériques dans beaucoup de problèmes physiques. Dans une étude précédente~\cite{Agullo2013}, nous avons montré que l'utilisation d'un paradigme à base de tâches fournit la flexibilité nécessaire pour traiter efficacement un large spectre de distributions de particules sur des architectures homogènes. Dans ce document, nous montrons maintenant comment une telle approche peut être étendue pour exploiter toutes les unités de calculs (CPU et GPU) des machines hétérogènes. Pour cela, nous présentons une version optimisée pour GPU des deux opérateurs dominants (P2P et M2L) de la FMM ainsi qu'une stratégie d'ordonnancement qui décide dynamiquement quelle proportion de tâches est traitée par les cœurs CPU et par des accélérateurs GPU. Nous évaluons notre méthode avec le moteur d'exécution StarPU pour exécuter le flot de tâches résultant sur un processeur Intel X5650 Nehalem augmenté avec un, deux ou trois Nvidia Fermi M2070 ou M2090. Une étude expérimentale détaillée sur deux distributions de 30 millions de particules (un cube et un ellipsoïde) montre que nous obtenons des résultats performants sur cette architecture.
Type de document :
Rapport
[Research Report] RR-8513, Inria. 2014, pp.29
Liste complète des métadonnées


https://hal.inria.fr/hal-00974674
Contributeur : Olivier Coulaud <>
Soumis le : lundi 7 avril 2014 - 12:21:09
Dernière modification le : vendredi 16 septembre 2016 - 15:08:34
Document(s) archivé(s) le : lundi 7 juillet 2014 - 11:11:17

Fichier

RR-8513.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-00974674, version 1

Collections

Relations

Citation

Emmanuel Agullo, Berenger Bramas, Olivier Coulaud, Eric Darve, Matthias Messner, et al.. Task-based FMM for heterogeneous architectures. [Research Report] RR-8513, Inria. 2014, pp.29. <hal-00974674>

Partager

Métriques

Consultations de
la notice

456

Téléchargements du document

832