Simultaneous Scheduling of Replication and Computation for Data-Intensive Applications on the Grid - Archive ouverte HAL Access content directly
Reports (Research Report) Year : 2005

Simultaneous Scheduling of Replication and Computation for Data-Intensive Applications on the Grid

(1) , (1)
1

Abstract

One of the first motivations of using grids comes from applications managing large data sets like for example in High Energy Physic or Life Sciences. To improve the global throughput of software environments, replicas are usually put at wisely selected sites. Moreover, computation requests have to be scheduled among the available resources. To get the best performance, scheduling and data replication have to be tightly coupled which is not always the case in existing approaches. This paper presents an algorithm that combines data management and scheduling at the same time using a steady-state approach. Our theoretical results are validated using simulation and logs from a large life science application (ACI GRID GriPPS).
L'une des principales motivations pour utiliser les grilles de calcul vient des applications utilisant de larges ensembles de données comme, par exemple, en Physique des Hautes Energies ou en Science de la Vie. Pour améliorer le rendement global des environnements logiciels utilisées pour porter ces applications sur les grilles, des réplicats des données sont déposées sur différents sites sélectionnés. De plus es requêtes de calcul doivent être ordonnancées en tenant compte des ressources disponibles. Pour obtenir de meilleures performances, l'ordonnancement des requêtes et la réplication des données doivent être étroitement couplés ce qui n'est généralement pas le cas dans les approches existantes. Cet article présente un algorithme qui combine la gestion des données et l'ordonnancement en utilisant une approche en régime permanent. Nos résultats théoriques sont validés par simulations et par l'utilisation des traces d'un serveur de calcul d'application de Sciences de la Vie(ACIGRIDGRIPPS).
Fichier principal
Vignette du fichier
RR-5460.pdf (219.37 Ko) Télécharger le fichier
Vignette du fichier
RR2005-01.pdf (387.91 Ko) Télécharger le fichier
Loading...

Dates and versions

inria-00070546 , version 1 (19-05-2006)

Identifiers

  • HAL Id : inria-00070546 , version 1

Cite

Frédéric Desprez, Antoine Vernois. Simultaneous Scheduling of Replication and Computation for Data-Intensive Applications on the Grid. [Research Report] RR-5460, LIP RR-2005-01, INRIA, LIP. 2005, pp.19. ⟨inria-00070546⟩
193 View
153 Download

Share

Gmail Facebook Twitter LinkedIn More