Fully Empirical Autotuned QR Factorization For Multicore Architectures

Résumé : L'optimisation de librairies numériques est devenue de plus en plus difficile, en même temps que les systèmes se sont complexifiées. En particulier, les machines multi-coeur modernes rendent le comportement des algorithmes difficile à prévoir et modéliser. Dans ce papier, nous étudions le problème de l'optimisation d'une factorisation QR dense sur des architectures multi-coeur. Nous montrons qu'il est difficile d'utiliser un modèle précis, ce qui nous motive pour concevoir une méthode entièrement empirique. Nous mettons en avant quelques propriétés empiriques vérifiées sur un large ensemble de plate-formes. Ces propriétés nous permettent de réduire l'espace de recherche. Notre méthode est automatique, rapide et fiable. Le processus d'optimisation est en effet complètement effectué lors de l'installation de la librairie en moins d'une heure et dix minutes pour cinq des sept plate-formes étudiées. Nous atteigons une performance moyenne variant de 97% à 100% de la performance optimale selon les plate-formes. Ce travail est une base pour l'optimisation automatique de la librairie PLASMA et permettre ainsi la portabilité de sa performance.
Type de document :
Rapport
[Research Report] RR-7526, INRIA. 2011, pp.22
Liste complète des métadonnées


https://hal.inria.fr/inria-00569514
Contributeur : Emmanuel Agullo <>
Soumis le : vendredi 25 février 2011 - 12:12:42
Dernière modification le : samedi 17 septembre 2016 - 01:36:39
Document(s) archivé(s) le : jeudi 30 juin 2011 - 13:52:56

Fichiers

rr.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : inria-00569514, version 1
  • ARXIV : 1102.5328

Collections

Citation

Emmanuel Agullo, Jack Dongarra, Rajib Nath, Stanimire Tomov. Fully Empirical Autotuned QR Factorization For Multicore Architectures. [Research Report] RR-7526, INRIA. 2011, pp.22. <inria-00569514>

Partager

Métriques

Consultations de
la notice

310

Téléchargements du document

645