CliqueSquare: Flat Plans for Massively Parallel RDF Queries

François Goasdoué 1 Zoi Kaoudi 2 Ioana Manolescu 3, 4 Jorge Quiané-Ruiz 5 Stamatis Zampetakis 3, 4, *
* Auteur correspondant
1 PILGRIM - Gradedness, Imprecision, and Mediation in Database Management Systems
IRISA-D7 - GESTION DES DONNÉES ET DE LA CONNAISSANCE
3 OAK - Database optimizations and architectures for complex large data
LRI - Laboratoire de Recherche en Informatique, UP11 - Université Paris-Sud - Paris 11, Inria Saclay - Ile de France, CNRS - Centre National de la Recherche Scientifique : UMR8623
Résumé : Pour faire face à l'explosion du volume de données RDF produites et analysées quotidiennement, de nombreux systèmes de stockage et d'interrogation de données RDF massivement distribués ont été développés. Ces architectures sont caractérisées par leur méthode de partitionnement et de stockage de données RDF d'une part, et, d'autre part, par la façon dont elles optimisent les requêtes, c'est-à-dire la manière dont les calculs sont distribués entre les différents nœuds afin de calculer les réponses. Cet article présente CliqueSquare, une nouvelle approche d'optimisation pour l'évaluation de requêtes RDF conjonctives dans un environnement massivement parallèle. Notre but principal est de réduire le temps de réponse des requêtes; pour cela, nous nous intéressons aux plans d'éxecution "plats" (de faible hauteur), dans lesquels le nombre de jointures successives sur un chemin allant de la racine du plan d'exécution jusqu'à l'un de ses opérateurs feuilles est minimisé. Nous présentons une famille d'algorithmes d'optimisation, basés sur des jointures d'égalité n-aires (en "étoile"), pour construire des plans plats et comparons leurs capacités à trouver les plans les plus plats possibles. Nous avons implémenté nos algorithmes dans une plate-forme RDF basée sur MapReduce; nos expériences démontrent l'intérêt des plans plats construits par nos meilleurs algorithmes d'optimisation.
Type de document :
Rapport
[Research Report] RR-8612, INRIA Saclay; INRIA. 2014
Liste complète des métadonnées

Littérature citée [34 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/hal-01071984
Contributeur : Stamatis Zampetakis <>
Soumis le : mardi 14 avril 2015 - 14:57:03
Dernière modification le : mercredi 2 août 2017 - 10:10:09
Document(s) archivé(s) le : mardi 18 avril 2017 - 19:12:19

Fichier

RR-8612.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-01071984, version 2

Citation

François Goasdoué, Zoi Kaoudi, Ioana Manolescu, Jorge Quiané-Ruiz, Stamatis Zampetakis. CliqueSquare: Flat Plans for Massively Parallel RDF Queries. [Research Report] RR-8612, INRIA Saclay; INRIA. 2014. 〈hal-01071984v2〉

Partager

Métriques

Consultations de la notice

548

Téléchargements de fichiers

314