Bound the Peak Performance of SGEMM on GPU with software-controlled fast memory

Junjie Lai 1 André Seznec 1
1 ALF - Amdahl's Law is Forever
Inria Rennes – Bretagne Atlantique , IRISA-D3 - ARCHITECTURE
Abstract : In this paper, we studied the NVIDIA GPU architecture characteristics concerning the SGEMM routine and the potential peak performance of SGEMM on Fermi GPU. Guiding by the analysis, our SGEMM routine achieved about 11% (NN), 4.5% (TN), 3% (NT) and 9% (TT) better performance than cublas in CUDA 4.1 package for large matrices on GTX580 Fermi Card. We also described how to use native assembly language directly in the CUDA runtime source code.
Type de document :
Rapport
[Research Report] RR-7923, INRIA. 2012
Liste complète des métadonnées

Littérature citée [4 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/hal-00686006
Contributeur : Junjie Lai <>
Soumis le : mardi 10 avril 2012 - 10:19:09
Dernière modification le : mercredi 11 avril 2018 - 02:00:45
Document(s) archivé(s) le : vendredi 31 mars 2017 - 04:30:28

Fichier

techReport.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-00686006, version 2

Citation

Junjie Lai, André Seznec. Bound the Peak Performance of SGEMM on GPU with software-controlled fast memory. [Research Report] RR-7923, INRIA. 2012. 〈hal-00686006v2〉

Partager

Métriques

Consultations de la notice

399

Téléchargements de fichiers

355