Preserving Fairness in Shared Hadoop Cluster: A Study on the Impact of (Non-) Preemptive Approaches - Archive ouverte HAL Access content directly
Reports (Research Report) Year : 2020

Preserving Fairness in Shared Hadoop Cluster: A Study on the Impact of (Non-) Preemptive Approaches

(1) , (2)
1
2

Abstract

Recently, MapReduce and its open-source implementation Hadoop have emerged as prevalent tools for big data analysis in the cloud. Fair resource allocation in-between jobs and users is an important issue, especially in multi-tenant environments such as clouds. Thus several scheduling policies have been developed to preserve fairness in multi-tenant Hadoop clusters. At the core of these schedulers, simple (non-) preemptive approaches are employed to free resources for tasks belonging to jobs with less-share. For example, Hadoop Fair Scheduler is equipped with two approaches: wait and kill. While wait may introduce a serious violation in fairness, kill may result in a huge waste of resources. Yet, recently some works have introduced new preemption approaches (e.g., pause-resume) in shared Hadoop clusters. To this end, in this work, we closely examine three approaches including wait, kill and pause-resume when Hadoop Fair Scheduler is employed for ensuring fair execution between multiple concurrent jobs. We perform extensive experiments to assess the impact of these approaches on performance and resource utilization while ensuring fairness. Our experimental results bring out the differences between these approaches and illustrate that these approaches are only sub-optimal for different workloads and cluster configurations: the efficiency of achieving fairness and the overall performance varies with the workload composition, resource availability and the cost of the adopted preemption technique.
Récemment, le paradigme MapReduce et son implémentation open-source Hadoop sont devenus des outils très populaires pour l’analyse de données massives dans le Cloud. Le partage équitable des ressources entre les différentes tâches et utilisateurs est un problème important, en particulier dans les architectures multi-tenant comme le Cloud. De nombreuses stratégies d’ordonnancement ont donc été développées pour préserver l’équité dans les cluster Hadoop multi-tenant. Au cœur de ces ordonnanceurs, des approches simples et non-préemptives sont utilisées pour libérer des ressources pour des tâches appartenant à des utilisateurs en ayant eu jusque-là une part plus faible. Par exemple, Hadoop Fair Scheduler possède deux approches : "attendre" et "tuer". Si "attendre" peut causer des sérieuses ruptures d’équité, "tuer" peut aussi entraîner un important gaspillage des ressources. Cependant, certains travaux récents ont introduit des techniques préemptives (c’est-à-dire "arrêter-reprendre") dans les clusters Hadoop partagés. Dans ce travail, nous examinons précisément trois approches, incluant "attendre", "tuer" et "arrêter-reprendre", lorsque Hadoop Fair Scheduler est utilisé pour assurer une répartition équitable des ressources lors de l’exécution de plusieurs groupes de tâches concurrents. Nous avons mené des expériences étendues pour évaluer l’impact de ces approches sur les performances et l’utilisation des ressources tout en garantissant leur partage équitable. Les résultats de nos expériences mettent en évidence les différences entre ces stratégies et montrent que chacune est sous-optimale pour une partie des workloads et des configurations : la capacité à garantir l’équité et les performances globales varient en fonction de la composition des tâches, des ressources disponibles et du coût des techniques préemptives.
Fichier principal
Vignette du fichier
RR-9384.pdf (515.74 Ko) Télécharger le fichier
Origin : Files produced by the author(s)

Dates and versions

hal-03091371 , version 1 (04-01-2021)

Identifiers

  • HAL Id : hal-03091371 , version 1

Cite

Orcun Yildiz, Shadi Ibrahim. Preserving Fairness in Shared Hadoop Cluster: A Study on the Impact of (Non-) Preemptive Approaches. [Research Report] RR-9384, Inria Rennes - Bretagne Atlantique. 2020. ⟨hal-03091371⟩
89 View
124 Download

Share

Gmail Facebook Twitter LinkedIn More