s'authentifier
version française rss feed

inria-00522937, version 2

Spherical harmonic transform with GPUs

Ioan Ovidiu Hupca () a1, Joel Falcou () b2, Laura Grigori () 1, R. Stompor c3

Workshop on High Performance Scientific Software (2011) 20

Résumé : We describe an algorithm for computing an inverse spherical harmonic transform suitable for graphic processing units (GPU). We use CUDA and base our implementation on a Fortran90 routine included in a publicly available parallel package, S2hat. We focus our attention on the two major sequential steps involved in the transforms computation, retaining the efficient parallel framework of the original code. We detail optimization techniques used to enhance the performance of the CUDA-based code and contrast them with those implemented in the Fortran90 version. We also present performance comparisons of a single CPU plus GPU unit with the \s2hat code running on either a single or 4 processors. In particular we find that use of the latest generation of GPUs, such as NVIDIA GF100 (Fermi), can accelerate the spherical harmonic transforms by as much as 18 times with respect to S2hat executed on one core, and by as much as 5.5 with respect to S2hat on 4 cores, with the overall performance being limited by the Fast Fourier transforms. The work presented here has been performed in the context of the Cosmic Microwave Background simulations and analysis. However, we expect that the developed software will be of more general interest and applicability.

  • Domaine : Informatique/Calcul parallèle, distribué et partagé
    Physique/Astrophysique/Cosmologie et astrophysique extra-galactique
    Planète et Univers/Astrophysique/Cosmologie et astrophysique extra-galactique
  • Référence interne : RR-7409
  • Versions disponibles :  v1 (04-10-2010) v2 (06-10-2010)
 
  • inria-00522937, version 2
  • oai:hal.inria.fr:inria-00522937
  • Contributeur : 
  • Soumis le : Mercredi 6 Octobre 2010, 09:48:58
  • Dernière modification le : Jeudi 28 Juin 2012, 13:37:21
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...