Extraction de clés de liage de données (résumé étendu)

Jérôme Euzenat 1
1 EXMO - Computer mediated exchange of structured knowledge
Inria Grenoble - Rhône-Alpes, LIG - Laboratoire d'Informatique de Grenoble
Résumé : De grandes quantités de données sont publiées sur le web des données. Les lier consiste à identifier les mêmes ressources dans deux jeux de données permettant l'exploitation conjointe des données publiées. Mais l'extraction de liens n'est pas une tâche facile. Nous avons développé une approche qui extrait des clés de liage (link keys). Les clés de liage étendent la notion de clé de l'algèbre relationnelle à plusieurs sources de données. Elles sont fondées sur des ensembles de couples de propriétés identifiant les objets lorsqu'ils ont les mêmes valeurs, ou des valeurs communes, pour ces propriétés. On présentera une manière d'extraire automatiquement les clés de liage candidates à partir de données. Cette opération peut être exprimée dans l'analyse formelle de concepts. La qualité des clés candidates peut-être évaluée en fonction de la disponibilité (cas supervisé) ou non (cas non supervisé) d'un échantillon de liens. La pertinence et de la robustesse de telles clés seront illustrées sur un exemple réel.
Document type :
Conference papers
Complete list of metadatas

https://hal.inria.fr/hal-01382101
Contributor : Jérôme Euzenat <>
Submitted on : Saturday, October 15, 2016 - 6:10:07 PM
Last modification on : Friday, October 12, 2018 - 1:18:02 AM

File

euzenat2016a.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : hal-01382101, version 1

Collections

Citation

Jérôme Euzenat. Extraction de clés de liage de données (résumé étendu). 16e conférence internationale francophone sur extraction et gestion des connaissances (EGC), Jan 2016, Reims, France. pp.9-12. ⟨hal-01382101⟩

Share

Metrics

Record views

201

Files downloads

209