Improving MPI Application Communication Time with an Introspection Monitoring Library - Archive ouverte HAL Access content directly
Reports (Research Report) Year : 2019

Improving MPI Application Communication Time with an Introspection Monitoring Library

(1) , (2)
1
2

Abstract

In this report we describe how to improve communication time of MPI parallel applications with the use of a library that enables to monitor MPI applications and allows for introspection (the program itself can query the state of the monitoring system). Based on previous work, this library is able to see how collective communications are decomposed into point-to-point messages. It also features monitoring sessions that allow suspending and restarting the monitoring, limiting it to specific portions of the code. Experiments show that the monitoring overhead is very small and that the proposed features allow for dynamic and efficient rank reordering enabling up to 2-time reduction of communication parts of some program.
Dans ce rapport, nous décrivons comment améliorer le temps de communication d’applications parallèles écrites en MPI. Pour cela, nous proposons, une bibliothèque qui effectue du contrôle (monitoring) introspectif des applications MPI : le programme peut lui-même interroger le système de contrôle/monitoring). Cette bibliothèque se base sur des travaux précédents qui permettent de voir comment les communications collectives sont décomposées en messages point-à-point. Cette bibliothèque présente aussi des sessions de monitoring pour suspendre et de redémarrer le contrôle permettant de limiter celui-ci à une portion précise du code. Les expériences montrent que le surcout est très faible et que ses caractéristiques permettent une réorganisation dynamique et efficace des rangs résultant à une réduction de moitié du temps de communication de certaines parties du programme
Fichier principal
Vignette du fichier
rr-monitoring-lib.pdf (862.68 Ko) Télécharger le fichier
Origin : Files produced by the author(s)
Loading...

Dates and versions

hal-02304515 , version 1 (03-10-2019)

Identifiers

  • HAL Id : hal-02304515 , version 1

Cite

Emmanuel Jeannot, Richard Sartori. Improving MPI Application Communication Time with an Introspection Monitoring Library. [Research Report] RR-9292, Inria. 2019, pp.23. ⟨hal-02304515⟩
140 View
451 Download

Share

Gmail Facebook Twitter LinkedIn More