Extraction de clés de liage de données (résumé étendu)

Jérôme Euzenat 1
1 EXMO - Computer mediated exchange of structured knowledge
Inria Grenoble - Rhône-Alpes, LIG - Laboratoire d'Informatique de Grenoble
Résumé : De grandes quantités de données sont publiées sur le web des données. Les lier consiste à identifier les mêmes ressources dans deux jeux de données permettant l'exploitation conjointe des données publiées. Mais l'extraction de liens n'est pas une tâche facile. Nous avons développé une approche qui extrait des clés de liage (link keys). Les clés de liage étendent la notion de clé de l'algèbre relationnelle à plusieurs sources de données. Elles sont fondées sur des ensembles de couples de propriétés identifiant les objets lorsqu'ils ont les mêmes valeurs, ou des valeurs communes, pour ces propriétés. On présentera une manière d'extraire automatiquement les clés de liage candidates à partir de données. Cette opération peut être exprimée dans l'analyse formelle de concepts. La qualité des clés candidates peut-être évaluée en fonction de la disponibilité (cas supervisé) ou non (cas non supervisé) d'un échantillon de liens. La pertinence et de la robustesse de telles clés seront illustrées sur un exemple réel.
Type de document :
Communication dans un congrès
Bruno Crémilleux ; Cyril de Runz. 16e conférence internationale francophone sur extraction et gestion des connaissances (EGC), Jan 2016, Reims, France. Hermann, Actes 16e conférence internationale francophone sur extraction et gestion des connaissances (EGC), pp.9-12, 2016
Liste complète des métadonnées

https://hal.inria.fr/hal-01382101
Contributeur : Jérôme Euzenat <>
Soumis le : samedi 15 octobre 2016 - 18:10:07
Dernière modification le : vendredi 12 octobre 2018 - 01:18:02

Fichier

euzenat2016a.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-01382101, version 1

Collections

Citation

Jérôme Euzenat. Extraction de clés de liage de données (résumé étendu). Bruno Crémilleux ; Cyril de Runz. 16e conférence internationale francophone sur extraction et gestion des connaissances (EGC), Jan 2016, Reims, France. Hermann, Actes 16e conférence internationale francophone sur extraction et gestion des connaissances (EGC), pp.9-12, 2016. 〈hal-01382101〉

Partager

Métriques

Consultations de la notice

186

Téléchargements de fichiers

182