Optimizing Reformulation-based Query Answering in RDF - Inria - Institut national de recherche en sciences et technologies du numérique Accéder directement au contenu
Rapport (Rapport De Recherche) Année : 2014

Optimizing Reformulation-based Query Answering in RDF

Optimisation de la réponse aux requêtes par reformulation dans les bases de données RDF

Résumé

Reformulation-based query answering is a query processing technique aiming at answering queries under constraints. It consists of reformulating the query based on the constraints, so that evaluating the reformulated query directly against the data (i.e., without considering any more the constraints) produces the correct answer set.In this paper, we consider optimizing reformulation-based query answering in the setting of ontology-based data access, where SPARQL conjunctive queries are posed against RDF facts on which constraints expressed by an RDF Schema hold. The literature provides query reformulation algorithms for many fragments of RDF. However, reformulated queries may be complex, thus may not be efficiently processed by a query engine; well established query engines even fail processing them in some cases.Our contribution is (i) to generalize prior query reformulation languages, leading to investigating a space of reformulated queries we call JUCQs (joins of unions of conjunctive queries), instead of a single reformulation; and (ii) an effective and efficient cost-based algorithm for selecting from this space, the reformulated query with the lowest estimated cost. Our experiments show that our technique enables reformulation-based query answering where the state-of-the-art approaches are simply unfeasible, while it may decrease its cost by orders of magnitude in other cases.
La technique de réponse aux requêtes par reformulation vise à répondre à des requêtes sur des données sous contraintes. Elle consiste de reformuler la requête en fonction des contraintes, de sorte que l’évaluation de la requête reformulée, directement sur les données (c’est-à-dire en ne tenant plus compte des contraintes), produit l’ensemble de réponses correctes.Dans cet article, nous considérons l’optimisation de la réponse aux requêtes par reformulation dans le cadre de l’accès aux données au travers d’ontologies, où des requêtes conjonctives SPARQL sont posées sur des faits RDF associés à des contraintes de schéma RDF. La littérature fournit des solutions pour divers fragments de RDF, visant à calculer l’union équivalente de requêtes conjonctives maximalement contenues par rapport aux contraintes. Mais, en général, une telle union est grande et ne peut être efficacement traitée par un moteur de requêtes.Notre contribution est (i) de généraliser le langage de reformulation de requêtes afin de couvrir un espace de requêtes reformulées équivalentes (au lieu d’avoir une seule reformulation possible), puis (ii) de sélectionner la requête reformulée avec le coût d’évaluation estimée le plus bas. Nos expériences montrent que notre technique permet la réponse aux requêtes par reformulation où les approches sur l’état de l’art sont tout simplement irréalisable, tandis qu’elle peut diminuer leurs coûts de plusieurs ordres de grandeur dans les autres cas.
Fichier principal
Vignette du fichier
RR-8646.pdf (1.41 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-01091214 , version 1 (04-12-2014)

Identifiants

  • HAL Id : hal-01091214 , version 1

Citer

Damian Bursztyn, François Goasdoué, Ioana Manolescu. Optimizing Reformulation-based Query Answering in RDF. [Research Report] RR-8646, INRIA Saclay; INRIA. 2014. ⟨hal-01091214⟩
394 Consultations
262 Téléchargements

Partager

Gmail Facebook X LinkedIn More