High performance tensor-vector multiplies on shared memory systems - Inria - Institut national de recherche en sciences et technologies du numérique Accéder directement au contenu
Rapport (Rapport De Recherche) Année : 2019

High performance tensor-vector multiplies on shared memory systems

Multiplication tenseur–vecteur haute performance sur des machines à memoire partagée

Résumé

Tensor–vector multiplication is one of the core components in tensor computations. We have recently investigated high performance, single core implementation of this bandwidth-bound operation. In this work, we investigate efficient, shared memory algorithms to carry out this operation. Upon carefully analyzing the design space, we implement a number of alternatives using OpenMP and compare them experimentally. Experimental results on up to 8 socket systems show near peak performance for the proposed algorithms.
La multiplication tenseur–vecteur est l’un des composants essentiels des calculs de tenseurs. Nous avons récemment étudié cette opération, qui consomme la bande passante, sur une plateforme séquentielle. Dans ce travail, nous étudions des algorithmes efficaces pour effectuer cette opération sur des machines à mémoire partagée. Après avoir soigneusement analysé les différentes alternatives, nous mettons en œuvre plusieurs d’entre elles en utilisant OpenMP, et nous les comparons expérimentalement. Les résultats expérimentaux sur un à huit systèmes de sockets montrent une performance quasi maximale pour les algorithmes proposés
Fichier principal
Vignette du fichier
RR-9274.pdf (898.8 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-02123526 , version 1 (08-05-2019)
hal-02123526 , version 2 (24-10-2019)

Identifiants

  • HAL Id : hal-02123526 , version 2

Citer

Filip Pawłowski, Bora Uçar, Albert-Jan Yzelman. High performance tensor-vector multiplies on shared memory systems. [Research Report] RR-9274, Inria - Research Centre Grenoble – Rhône-Alpes. 2019, pp.1-20. ⟨hal-02123526v2⟩
130 Consultations
312 Téléchargements

Partager

Gmail Facebook X LinkedIn More