The impact of cache misses on the performance of matrix product algorithms on multicore platforms

Mathias Jacquelin 1 Loris Marchal 1, * Yves Robert 1
* Auteur correspondant
1 GRAAL - Algorithms and Scheduling for Distributed Heterogeneous Platforms
Inria Grenoble - Rhône-Alpes, LIP - Laboratoire de l'Informatique du Parallélisme
Résumé : La révolution multi-coeur est en cours, qui voit l'arrivée de processeurs dotées d'une architecture mémoire complexe. Les algorithmes les plus classiques doivent être revisités pour prendre en compte la disposition hiérarchique de la mémoire. Dans ce rapport, nous étudions des algorithmes prenant en compte les caches de données qui minimisent le nombre de défauts de cache pendant l'exécution d'un produit de matrices sur un processeur multi-coeur. Nous montrons analytiquement comment obtenir le meilleur compromis entre les caches partagés et distribués. Nous proposons une implémentation pour évaluer ces algorithmes sur deux plates-formes multi-coeur, l'une équipé d'un processeur Xeon quadri-coeur, l'autre dotée d'un GPU. Il apparaît que l'impact des défauts de cache est très différent sur ces deux plates-formes, et nous identifions quels sont les principaux paramètres de conception qui conduisent aux performances maximales pour chacune de ces configurations matérielles.
Type de document :
Rapport
[Research Report] RR-7456, INRIA. 2010, pp.32
Liste complète des métadonnées

Littérature citée [9 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/inria-00537822
Contributeur : Loris Marchal <>
Soumis le : vendredi 19 novembre 2010 - 14:32:06
Dernière modification le : samedi 21 avril 2018 - 01:27:07
Document(s) archivé(s) le : vendredi 26 octobre 2012 - 16:02:11

Fichier

RR-7456.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : inria-00537822, version 1

Collections

Citation

Mathias Jacquelin, Loris Marchal, Yves Robert. The impact of cache misses on the performance of matrix product algorithms on multicore platforms. [Research Report] RR-7456, INRIA. 2010, pp.32. 〈inria-00537822〉

Partager

Métriques

Consultations de la notice

208

Téléchargements de fichiers

187