Des données tabulaires à RDF : l'extraction de données de Google Fusion Tables

Résumé : Durant ces dernières années, un volume très important de données RDF, respectant les principes des données liées (LOD) établis par Tim Berners-Lee, ont été publiées. Toutefois, ces données ne représentent qu'une petite partie des données du web déjà disponibles dans d'autres formats, des données qu'il est impossible de traduire manuellement en RDF étant donné leur volume. Dans ce papier, nous présentons une approche d'extraction d'une partie de ces données via Google Fusion Tables dans le but de peupler une ontologie d'un domaine donné. Les données collectées sont issues de tableaux conçus par des millions d'internautes. Notre objectif est d'en extraire un sous-ensemble pertinent par rapport à des classes d'une ontologie que nous souhaitons instancier. Ces données seront ensuite représentées en RDF. Notre approche a été évaluée sur des données relatives à des restaurants et des musées.
Type de document :
Communication dans un congrès
Atelier Ontologies et Jeux de Données pour évaluer le Web Sémantique (OJD) associé à IC'2012, Jun 2012, Paris, France. 2012
Liste complète des métadonnées

https://hal.inria.fr/hal-00787434
Contributeur : Chantal Reynaud <>
Soumis le : mardi 12 février 2013 - 10:37:29
Dernière modification le : mardi 24 avril 2018 - 13:38:26

Identifiants

  • HAL Id : hal-00787434, version 1

Collections

Citation

Gianluca Quercini, Chantal Reynaud. Des données tabulaires à RDF : l'extraction de données de Google Fusion Tables. Atelier Ontologies et Jeux de Données pour évaluer le Web Sémantique (OJD) associé à IC'2012, Jun 2012, Paris, France. 2012. 〈hal-00787434〉

Partager

Métriques

Consultations de la notice

62