Optimizing 3D Convolutions for Wavelet Transforms on CPUs with SSE Units and GPUs

Abstract : Nanosimulations present a big HPC challenge as they present increasing performance demands in heterogeneous execution environments. In this paper, we present our optimization methodology for BigDFT, a nanosimulation software using Density Functional Theory. We explore autotuning possibilities for BigDFT's 3D convolutions by studying optimization techniques for several architectures. Namely, we focus on processors with vector units and on GPU acceleration. We report on the portability and the performance gains of our approach (speedup x2 on CPU, x5 on GPU) and discuss the relation between algorithmic specifics, architecture and performance.
Type de document :
Rapport
[Research Report] RR-LIG-032, 2013
Liste complète des métadonnées

Littérature citée [18 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/hal-00953056
Contributeur : Gwenaël Delaval <>
Soumis le : vendredi 28 février 2014 - 14:31:45
Dernière modification le : jeudi 11 octobre 2018 - 08:48:04
Document(s) archivé(s) le : mercredi 28 mai 2014 - 11:02:04

Fichier

RR-LIG-032.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-00953056, version 1

Citation

Brice Videau, Vania Marangozova-Martin, Luigi Genovese, Thierry Deutsch. Optimizing 3D Convolutions for Wavelet Transforms on CPUs with SSE Units and GPUs. [Research Report] RR-LIG-032, 2013. 〈hal-00953056〉

Partager

Métriques

Consultations de la notice

248

Téléchargements de fichiers

246