Des données tabulaires à RDF : l'extraction de données de Google Fusion Tables - Inria - Institut national de recherche en sciences et technologies du numérique Accéder directement au contenu
Communication Dans Un Congrès Année : 2012

Des données tabulaires à RDF : l'extraction de données de Google Fusion Tables

Gianluca Quercini
Chantal Reynaud

Résumé

Durant ces dernières années, un volume très important de données RDF, respectant les principes des données liées (LOD) établis par Tim Berners-Lee, ont été publiées. Toutefois, ces données ne représentent qu'une petite partie des données du web déjà disponibles dans d'autres formats, des données qu'il est impossible de traduire manuellement en RDF étant donné leur volume. Dans ce papier, nous présentons une approche d'extraction d'une partie de ces données via Google Fusion Tables dans le but de peupler une ontologie d'un domaine donné. Les données collectées sont issues de tableaux conçus par des millions d'internautes. Notre objectif est d'en extraire un sous-ensemble pertinent par rapport à des classes d'une ontologie que nous souhaitons instancier. Ces données seront ensuite représentées en RDF. Notre approche a été évaluée sur des données relatives à des restaurants et des musées.
Fichier non déposé

Dates et versions

hal-00787434 , version 1 (12-02-2013)

Identifiants

  • HAL Id : hal-00787434 , version 1

Citer

Gianluca Quercini, Chantal Reynaud. Des données tabulaires à RDF : l'extraction de données de Google Fusion Tables. Atelier Ontologies et Jeux de Données pour évaluer le Web Sémantique (OJD) associé à IC'2012, Jun 2012, Paris, France. ⟨hal-00787434⟩
55 Consultations
0 Téléchargements

Partager

Gmail Facebook X LinkedIn More