Introduction of shared-memory parallelism in a distributed-memory multifrontal solver

Résumé : Dans cet article, nous étudions l'adaptation d'un code parallèle à mémoire distribuée en un code visant les architectures à mémoire partagée de type multi-coeurs. L'intérêt d'adapter un code existant plutôt que d'en concevoir un nouveau est de pouvoir bénéficier directement de toute la richesse de ses fonctionnalités numériques ainsi que de ses caractéristiques internes. Même si le code sur lequel porte l'étude est un solveur direct multifrontale pour systèmes linéaires creux, les algorithmes et techniques discutés sont générales et peuvent s'appliquer à des domaines d'application plus généraux. Nous montrons comment des algorithmes parallèles existant peuvent être adaptés à un environnement OpenMP tout en exploitant au mieux des librairies existantes optimisées. Nous présentons des approches simples pour tirer parti des spécificités des architectures NUMA, ainsi que des optimisations originales permettant de limiter les coûts de synchronisation dans le modèle fork-join que l'on utilise. Pour chacun de ces points, les gains en performance sont analysés sur des cas tests provenant de domaines d'applications variés.
Type de document :
Rapport
[Research Report] RR-8227, INRIA. 2013, pp.35
Liste complète des métadonnées

Littérature citée [35 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/hal-00786055
Contributeur : Jean-Yves L'Excellent <>
Soumis le : mardi 12 février 2013 - 13:42:05
Dernière modification le : vendredi 20 avril 2018 - 15:44:27
Document(s) archivé(s) le : lundi 13 mai 2013 - 04:10:02

Fichier

RR-8227.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-00786055, version 1

Collections

Citation

Jean-Yves L'Excellent, Mohamed W. Sid-Lakhdar. Introduction of shared-memory parallelism in a distributed-memory multifrontal solver. [Research Report] RR-8227, INRIA. 2013, pp.35. 〈hal-00786055〉

Partager

Métriques

Consultations de la notice

426

Téléchargements de fichiers

780