HAP: Building Pipelines with Heterogeneous Data and Hive - Inria - Institut national de recherche en sciences et technologies du numérique Accéder directement au contenu
Pré-Publication, Document De Travail Année : 2017

HAP: Building Pipelines with Heterogeneous Data and Hive

Damien Graux
  • Fonction : Auteur
  • PersonId : 995612
Pierre Genevès
Nabil Layaïda

Résumé

The increasing number of available datasets gives opportunities to build large and complex applications which aggregate results coming from several sources. These emerging usecases require new systems where combinations of heterogeneous sources are both allowed and efficient. To tackle these challenges, we provide a simple high-level set of primitives – called HAP – to easily describe processing chains. These descriptions are then compiled into optimized SQL queries executed by Hive.

Domaines

Web
Fichier principal
Vignette du fichier
report-hap.pdf (404.44 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-01436850 , version 1 (16-01-2017)

Identifiants

  • HAL Id : hal-01436850 , version 1

Citer

Damien Graux, Pierre Genevès, Nabil Layaïda. HAP: Building Pipelines with Heterogeneous Data and Hive. 2017. ⟨hal-01436850⟩
220 Consultations
149 Téléchargements

Partager

Gmail Facebook X LinkedIn More