Introduction of shared-memory parallelism in a distributed-memory multifrontal solver

Jean-Yves L'Excellent; Mohamed W. Sid-Lakhdar

Rapport (Rapport De Recherche) Année : 2013

Introduction of shared-memory parallelism in a distributed-memory multifrontal solver

(1, 2) , (1, 2)

1
2

Jean-Yves L'Excellent

Fonction : Auteur
PersonId : 10316
IdHAL : jean-yves-lexcellent
ORCID : 0000-0001-5804-993X
IdRef : 078828031

Laboratoire de l'Informatique du Parallélisme

Optimisation des ressources : modèles, algorithmes et ordonnancement

Mohamed W. Sid-Lakhdar

Fonction : Auteur

Laboratoire de l'Informatique du Parallélisme

Optimisation des ressources : modèles, algorithmes et ordonnancement

Résumé

We study the adaptation of a parallel distributed-memory solver towards a shared-memory code, targeting multi-core architectures. The advantage of adapting the code over a new design is to fully benefit from its numerical kernels, range of functionalities and internal features. Although the studied code is a direct solver for sparse systems of linear equations, the approaches described in this paper are general and could be useful to a wide range of applications. We show how existing parallel algorithms can be adapted to an OpenMP environment while, at the same time, also relying on third-party optimized multithreaded libraries. We propose simple approaches to take advantage of NUMA architectures, and original optimizations to limit thread synchronization costs. For each point, the performance gains are analyzed in detail on test problems from various application areas.

Dans cet article, nous étudions l'adaptation d'un code parallèle à mémoire distribuée en un code visant les architectures à mémoire partagée de type multi-coeurs. L'intérêt d'adapter un code existant plutôt que d'en concevoir un nouveau est de pouvoir bénéficier directement de toute la richesse de ses fonctionnalités numériques ainsi que de ses caractéristiques internes. Même si le code sur lequel porte l'étude est un solveur direct multifrontale pour systèmes linéaires creux, les algorithmes et techniques discutés sont générales et peuvent s'appliquer à des domaines d'application plus généraux. Nous montrons comment des algorithmes parallèles existant peuvent être adaptés à un environnement OpenMP tout en exploitant au mieux des librairies existantes optimisées. Nous présentons des approches simples pour tirer parti des spécificités des architectures NUMA, ainsi que des optimisations originales permettant de limiter les coûts de synchronisation dans le modèle fork-join que l'on utilise. Pour chacun de ces points, les gains en performance sont analysés sur des cas tests provenant de domaines d'applications variés.

Mots clés

shared-memory multi-core NUMA LU factorization sparse matrix multifrontal method

Domaines

Calcul parallèle, distribué et partagé [cs.DC]

Fichier principal

RR-8227.pdf (762.67 Ko)

Origine : Fichiers produits par l'(les) auteur(s)

Jean-Yves L'Excellent : Connectez-vous pour contacter le contributeur

https://inria.hal.science/hal-00786055

Soumis le : mardi 12 février 2013-13:42:05

Dernière modification le : jeudi 1 février 2024-10:05:22

Archivage à long terme le : lundi 13 mai 2013-04:10:02

Dates et versions

hal-00786055 , version 1 (12-02-2013)

Identifiants

HAL Id : hal-00786055 , version 1

Citer

Jean-Yves L'Excellent, Mohamed W. Sid-Lakhdar. Introduction of shared-memory parallelism in a distributed-memory multifrontal solver. [Research Report] RR-8227, INRIA. 2013, pp.35. ⟨hal-00786055⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

ENS-LYON UNIV-RENNES1 CNRS INRIA UNIV-LYON1 IRISA INRIA-RRRT INRIA2 GENCI LARA UR1-MATH-STIC UR1-UFR-ISTIC UNIV-RENNES UDL UR1-MATH-NUM

231 Consultations

763 Téléchargements

Introduction of shared-memory parallelism in a distributed-memory multifrontal solver

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager