Query-Oriented Summarization of RDF Graphs

Résumé : RDF est le modèle de données du W3C, fondé sur les graphes, pour les applications du Web Séman- tique. Les graphes RDF sont souvent larges et hétérogènes, ce qui complique la tâche des utilisateurs qui tentent de se familiariser avec leurs structure et sémantique, ou de déterminer si un graphe est utile pour une application donnée. Nous étudions comment répondre à ces besoins en inspectant un résumé de graphe, une structure com- pacte portant autant d’information que possible à propos du graphe d’entrée. Un résumé est représen- tatif d’un graphe s’il représente à la fois ses triplets explicites et implicites, ces derniers découlant de contraintes de RDF Schema. Pour garantir la représentativité, nous définissons un nouvau cadre de ré- sumé de graphe spécifique à RDF, fondé sur une relation d’équivalence de noeuds RDF et le quotient de graphe ; notre cadre peut être instancié avec une multitude de relations d’équivalence de noeuds RDF. Nous montrons que nos résumés sont représentatifs et nous établissons une condition suffisante sur la relation d’équivalence de noeuds RDF pour garantir qu’un graphe peut être efficacement résumé, sans matérialiser ses triplets implicites. Nous démontrons que les relations d’équivalence entre noeuds de l’état de l’art, fondées sur la bissimulation de graphes, satisfont notre condition. De plus, nous instancions notre cadre avec quatre nouvelles relations d’équivalence de noeuds RDF, donnant lieu à quatre nouveaux types de résumés, fondées sur les cliques de propriétés, spécialement adaptées à la grande hétérogénéité des graphes RDF ; nous montrons que ces types de résumé sont plusieurs ordres de magnitude plus compacts que les résumés à base de bissimulation. Enfin, nous montrons que les résumés à base de bissimulation et deux de nos résumés à base de cliques peuvent être construits efficacement, de sorte qu’ils représentent les triplets explicites et implicites du graphe d’entrée sans avoir à le saturer. Les bénéfices de performance de notre méthode de résumé sont confirmés au travers d’un ensemble d’expériences.
Type de document :
Rapport
[Research Report] RR-8920, INRIA Saclay; Université Rennes 1. 2017
Liste complète des métadonnées

Littérature citée [37 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/hal-01325900
Contributeur : Ioana Manolescu <>
Soumis le : jeudi 8 juin 2017 - 13:34:44
Dernière modification le : vendredi 30 juin 2017 - 01:11:24
Document(s) archivé(s) le : samedi 9 septembre 2017 - 12:56:30

Fichier

RR (1).pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-01325900, version 4

Citation

Šejla Čebirić, François Goasdoué, Ioana Manolescu. Query-Oriented Summarization of RDF Graphs. [Research Report] RR-8920, INRIA Saclay; Université Rennes 1. 2017. 〈hal-01325900v4〉

Partager

Métriques

Consultations de la notice

116

Téléchargements de fichiers

31