Optimization and parallelization of Emedge3D on shared memory architecture

Résumé : Ce rapport présente des stratégies pour la réduction du temps d'exécution d'un code de simulation numérique. Ces stratégies interviennent autant au niveau optimisation séquentielle qu'au niveau de la parallélisation OpenMP. Cette étude a été menée sur deux architectures à mémoire partagée : une carte à la pointe de la technologie comprenant 8x8 coeurs et une autre plus commune intégrant un processeur de 2x6 coeurs. Comme pour beaucoup d'applications du même type, les performances de la parallélisation du code numérique cible sont limitées par la bande passante mémoire. Les techniques que nous présentons dans ce document montrent comment contourner cette limitation. Afin d'obtenir des accélérations efficaces, différentes stratégies sont mises en oeuvre au niveau des calculs, mais aussi au niveau de l'accès aux données. Les optimisations en question sont la minimisation du nombre d'accès à la mémoire, la simplification et le ré-ordonnancement des calculs et le tiling pour maximiser l'utilisation des caches mémoire. Sur le processeur Intel X5675 (12 coeurs), l'accumulation de ces optimisations et la parallélisation permet d'obtenir un code 21.6 fois plus rapide par rapport à la version initiale sur un seul coeur.
Type de document :
Communication dans un congrès
IEEE, Sep 2013, timisoara, Romania. pp.503-510, 2013, SYNASC. 〈10.1109/SYNASC2013.72〉
Liste complète des métadonnées

Littérature citée [12 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/hal-00848869
Contributeur : Nicolas Crouseilles <>
Soumis le : lundi 29 juillet 2013 - 14:18:15
Dernière modification le : lundi 1 octobre 2018 - 16:03:09
Document(s) archivé(s) le : mercredi 30 octobre 2013 - 04:12:37

Fichier

RR-8336.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

Citation

Matthieu Kuhn, Guillaume Latu, Stéphane Genaud, Nicolas Crouseilles. Optimization and parallelization of Emedge3D on shared memory architecture. IEEE, Sep 2013, timisoara, Romania. pp.503-510, 2013, SYNASC. 〈10.1109/SYNASC2013.72〉. 〈hal-00848869〉

Partager

Métriques

Consultations de la notice

561

Téléchargements de fichiers

189