HAP: Building Pipelines with Heterogeneous Data and Hive

Damien Graux 1 Pierre Genevès 1 Nabil Layaïda 1
1 TYREX - Types and Reasoning for the Web
Inria Grenoble - Rhône-Alpes, LIG - Laboratoire d'Informatique de Grenoble
Abstract : The increasing number of available datasets gives opportunities to build large and complex applications which aggregate results coming from several sources. These emerging usecases require new systems where combinations of heterogeneous sources are both allowed and efficient. To tackle these challenges, we provide a simple high-level set of primitives – called HAP – to easily describe processing chains. These descriptions are then compiled into optimized SQL queries executed by Hive.
Type de document :
Pré-publication, Document de travail
2017
Domaine :
Liste complète des métadonnées


https://hal.inria.fr/hal-01436850
Contributeur : Tyrex Equipe <>
Soumis le : lundi 16 janvier 2017 - 17:31:24
Dernière modification le : jeudi 19 janvier 2017 - 01:02:38
Document(s) archivé(s) le : lundi 17 avril 2017 - 16:34:28

Fichier

report-hap.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-01436850, version 1

Collections

Citation

Damien Graux, Pierre Genevès, Nabil Layaïda. HAP: Building Pipelines with Heterogeneous Data and Hive. 2017. <hal-01436850>

Partager

Métriques

Consultations de
la notice

306

Téléchargements du document

85