Request Replication for FaaS Fault Tolerance - Archive ouverte HAL Access content directly
Reports (Research Report) Year : 2022

Request Replication for FaaS Fault Tolerance

Réplication de requêtes pour la tolérance aux pannes de FaaS

(1, 2) , (2) , (1) , (3) , (2)
1
2
3

Abstract

Function-as-a-Service (FaaS) is a popular programming model for building serverless applications, supported by all major cloud providers and many open-source software frameworks. One of the main challenges for FaaS providers is providing fault-tolerance for the deployed applications. The basic fault-tolerance mechanism in current FaaS platforms is automatically retrying function invocations. Although the retry mechanism is well suited for transient faults, it incurs delays in recovering from other types of faults, such as node crashes. This paper proposes the integration of a Request Replication mechanism in FaaS platforms and describes how this integration was implemented in a well-known, open-source platform. The paper provides a detailed experimental comparison of the proposed mechanism with the retry mechanism and an Active-Standby mechanism under different failure scenarios.
Le Function-as-a-Service (FaaS) est un modèle de programmation populaire pour la création d’applications sans serveur, pris en charge par tous les principaux fournisseurs de cloud et de nombreux frameworks logiciels open source. L’un des principaux défis pour les fournisseurs de FaaS est de fournir une tolérance aux pannes pour les applications déployées. Le mécanisme de base de tolérance aux pannes des plates-formes FaaS actuelles réessaie automatiquement les appels de fonction. Bien que le mécanisme de nouvelle tentative soit bien adapté aux pannes transitoires, il entraîne des retards dans la récupération d’autres types de pannes, telles que les pannes de noeuds. Cet article propose l’intégration d’un mécanisme de réplication de requêtes dans les plates-formes FaaS et décrit comment cette intégration a été implémentée dans une plate-forme open source bien connue. L’article fournit une comparaison expérimentale détaillée du mécanisme proposé avec le mécanisme de nouvelle tentative et un mécanisme Active-Standby sous différents scénarios de panne.
Fichier principal
Vignette du fichier
RR-9444.pdf (1.88 Mo) Télécharger le fichier
Origin : Files produced by the author(s)

Dates and versions

hal-03510322 , version 1 (04-01-2022)

Identifiers

  • HAL Id : hal-03510322 , version 1

Cite

Yasmina Bouizem, Djawida Dib, Nikos Parlavantzas, Christine Morin, Fedoua Lahfa. Request Replication for FaaS Fault Tolerance. [Research Report] RR-9444, Inria. 2022, pp.1-19. ⟨hal-03510322⟩
106 View
88 Download

Share

Gmail Facebook Twitter LinkedIn More