ExpRalytics: Expressive and Efficient Analytics for RDF Graphs - Inria - Institut national de recherche en sciences et technologies du numérique Accéder directement au contenu
Thèse Année : 2021

ExpRalytics: Expressive and Efficient Analytics for RDF Graphs

ExpRalytics: analyse expressive et efficace de graphes RDF

Résumé

Large (Linked) Open Data are increasingly shared as RDF graphs today. However, such data does not yet reach its full potential in terms of sharing and reuse. We provide new methods to meaningfully summarize data graphs, with a particular focus on RDF graphs. One class of tools for this task are structural RDF graph summaries, which allow users to grasp the different connections between RDF graph nodes. To this end, we introduce our novel RDFQuotient tool that finds compact yet informative RDF graph summaries that can serve as first-sight visualizations of an RDF graph’s structure. We also consider the problem of automatically identifying the k most interesting aggregate queries that can be evaluated on an RDF graph, given an integer k and a user-specified interestingness function. Aggregate queries are routinely used to learn insights from relational data warehouses, and some prior research has addressed the problem of automatically recommending interesting aggregate queries.
Les données ouvertes sont souvent partagées sous la forme de graphes RDF, qui sont une incarnation du principe Linked Open Data (données ouvertes liées). De telles données n’ont toutefois pas atteint leur entier potentiel d’utilisation et de partage. L’obstacle pour ce faire réside principalement au niveau de la capacité des utilisateurs à explorer, découvrir et saisir le contenu et des graphes RDF; cette tâche est complexe car les graphes sont naturellement hétérogènes, et peuvent être à la fois volumineux et complexes. Nous proposons de nouvelles méthodes pour résumer de grands graphes de données, avec un accent particulier sur les graphes RDF. A cette fin, nous avons proposé une nouvelle approché pour la construction de résumés structurels de graphes RDF, à savoir RDFQuotient. Nous considérons aussi le problème d’identifier automatiquement les requêtes d’agrégation les plus intéressantes qui peuvent être évaluées sur un graphe RDF.
Fichier principal
Vignette du fichier
Pawel-Guzewicz-thesis_submitted_on_2021_12_06.pdf (5.75 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

tel-03478282 , version 1 (13-12-2021)
tel-03478282 , version 2 (20-02-2022)

Identifiants

  • HAL Id : tel-03478282 , version 1

Citer

Pawel Guzewicz. ExpRalytics: Expressive and Efficient Analytics for RDF Graphs. Databases [cs.DB]. École polytechnique, 2021. English. ⟨NNT : ⟩. ⟨tel-03478282v1⟩
115 Consultations
127 Téléchargements

Partager

Gmail Facebook X LinkedIn More