s'authentifier
version française rss feed

inria-00389836, version 1

Interaction between MPI and TCP in grids

Ludovic Hablot (Auteur à contacter de préférence) a12, Olivier Glück () b12, Jean-Christophe Mignot c12, Romaric Guillier 12, Sébastien Soudan 12, Pascale Vicat-Blanc Primet (Auteur à contacter de préférence) a12

N° RR-6945 (2008)

Résumé : As MPI applications are more and more resource consuming, they need to be executed on grids. The communications on the WAN interconnecting clusters mostly use TCP which suffers from WAN features: high latency, sharing between users, bandwidth smaller than the aggregate bandwidth of the nodes. In this report, we first study the interaction between MPI and TCP on grids. We show why the nature of MPI traffic raises problems while using TCP on WAN links. TCP's loss detection and congestion control mechanism can both slow down the application. Then, we propose MPI5000, a transparent applicative layer between MPI and TCP, using proxies to improve the execution of MPI applications on a grid. Proxies aim at splitting TCP connections in order to detect losses faster and avoid to return in a slowstart phase after an idle time. Finally, we test our layer on Grid'5000, the French research grid, using MPICH2. The results on the NPB (NAS Parallel Benchmarks) validate our architecture that reduces the number of idle timeout and the number of long-distance retransmissions for certain benchmarks, namely BT, SP and LU benchmarks. Using MPI5000, these applications can decrease their execution time by 35%, 28%, and, 15% respectively.

  • a –  Ecole Normale Supérieure de Lyon - ENS Lyon
  • b –  Université Claude Bernard - Lyon I
  • c –  CNRS
  • 1 :  RESO (INRIA Rhône-Alpes)
  • INRIA – CNRS : UMR5668 – École Normale Supérieure - Lyon
  • 2 :  Laboratoire de l'Informatique du Parallélisme (LIP)
  • Université de Lyon – CNRS : UMR5668 – INRIA – École Normale Supérieure - Lyon – Université Claude Bernard - Lyon I
  • Domaine : Informatique/Calcul parallèle, distribué et partagé
  • Mots-clés : MPI – TCP – proxies – TCP Split – MPI5000
  • Référence interne : RR-6945
 
  • inria-00389836, version 1
  • oai:hal.inria.fr:inria-00389836
  • Contributeur : 
  • Soumis le : Vendredi 29 Mai 2009, 17:41:58
  • Dernière modification le : Jeudi 11 Juin 2009, 12:15:48
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...