Des triplets sur des arbres: un modèle hybride XML-RDF pour documents annotés - Inria - Institut national de recherche en sciences et technologies du numérique Accéder directement au contenu
Article Dans Une Revue Revue des Sciences et Technologies de l'Information - Série ISI : Ingénierie des Systèmes d'Information Année : 2012

Des triplets sur des arbres: un modèle hybride XML-RDF pour documents annotés

Résumé

Considerable energy is spent towards enriching XML data on the web with semantics through annotations. These annotations can range from simple metadata to complex semantic relationships between data items. Although the vision of supporting such annotations is spreading, it still lacks the infrastructure that will enable it. To this end we propose a framework enabling the storage and querying of annotated documents. We introduce (i) the XR data model, in which annotated documents are XML documents described by RDF triples and (ii) the query language XRQ to interrogate annotated documents through their structure and their semantics. The prototype platform XRP for the management of annotated documents has been developed, to show the relevance of our approach through experiments.
Une énergie considérable est consacrée à l'enrichissement sémantique de données XML du web via des annotations. Celles-ci vont de simples métadonnées jusqu'à des relations sémantiques complexes entre données. Bien que l'idée d'utiliser des annotations soit de plus en plus largement partagée, il reste à définir l'architecture qui permettra de la mettre en œuvre. Dans cet but, nous présentons un framework permettant le stockage et l'interrogation de documents annotés. Nous introduisons (i) le modèle de données XR, dans lequel les documents annotés sont des documents XML décrits sémantiquement par des triplets RDF, et (ii) le langage de requêtes XRQ permettant d'interroger les documents annotés par leur structure et leur sémantique. Un premier prototype de plate-forme de gestion de documents annotés, nommé XRP, a été développé, afin de montrer la pertinence de notre approche par une série d'expériences.

Dates et versions

hal-00765302 , version 1 (14-12-2012)

Identifiants

Citer

François Goasdoué, Konstantinos Karanasos, Yannis Katsis, Julien Leblay, Ioana Manolescu, et al.. Des triplets sur des arbres: un modèle hybride XML-RDF pour documents annotés. Revue des Sciences et Technologies de l'Information - Série ISI : Ingénierie des Systèmes d'Information, 2012, Bases de données avancées: modélisation, interrogation et optimisation, 17 (5), pp.87-111. ⟨10.3166/ISI.17.5.87-111⟩. ⟨hal-00765302⟩
325 Consultations
0 Téléchargements

Altmetric

Partager

Gmail Facebook X LinkedIn More