Data interlinking with relational concept analysis

Jérémy Vizzini 1
1 MOEX - Evolution de la connaissance
Inria Grenoble - Rhône-Alpes, LIG - Laboratoire d'Informatique de Grenoble
Résumé : Une grande quantité de données RDF est disponible sur le web par divers institutions créant des chevauchements d’informations. Afin d’être pleinement exploité, différentes représentations d’un même objet provenant de différents ensembles de données doivent être identifiées. C’est ce qu’on appelle le liage de données. Une nouvelle façon de générer de tels liens consiste à utiliser la notion de clés de liage. Les clés de liage génélarisent les clés en base de données en les appliquant à deux ensembles de données distincts. La structure de RDF rend ce problème beaucoup plus complexe que pour les bases de données relationnelles pour plusieurs raisons. Tout d’abord, une instance peut avoir plusieurs valeurs pour un attribut donné. De plus, les valeurs des propriétés ne sont pas forcément de types simples, ils peuvent tout aussi être d’autres instances du graphe. Une première méthode a été conçue afin d’extraire et de sélectionner des clés de liage à partir de deux classes d’objets composés par plusieurs propriétés ayant seulement des valeurs de types simples. Par ailleurs, l’étape d’extraction a été reformulée en analyse de concept formel (FCA) permettant de générer des clés de liaison pour des tables de bases de données relationnelles. Notre objectif est d’étendre ce travail afin qu’il puisse gérer de multiples valeurs. D’abord , nous montrons comment l’utiliser pour traiter les propriétés objet lorsque le jeu de données est exempt de cycles. Cet encodage ne génère pas nécessairement les clés de liage optimales. Par conséquent, nous utilisons l’analyse de concept relationnel (RCA), une extension de FCA prenant en compte les relations entre les concepts. Nous montrons qu’une nouvelle expression de ce problème est capable d’extraire les clés de liage de manière optimale même en présence de circularités. En outre, le processus élaboré ne requiert pas d’information à propos des alignements des classes des ontologies. Nous avons mis en oeuvre ces méthodes et les avons évaluées en reproduisant les expériences réalisées lors d’études antérieures. Cela nous a permis de montrer que la méthode extrait les résultats attendus ainsi que de mettre en évidence un problème de mise à l’échelle (également attendus).
Type de document :
Mémoires d'étudiants -- Hal-inria+
Artificial Intelligence [cs.AI]. 2017
Liste complète des métadonnées

Littérature citée [18 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/hal-01661184
Contributeur : Alain Monteil <>
Soumis le : lundi 11 décembre 2017 - 17:40:11
Dernière modification le : lundi 30 avril 2018 - 15:02:01

Fichier

m2r-vizzini-1.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-01661184, version 1

Citation

Jérémy Vizzini. Data interlinking with relational concept analysis. Artificial Intelligence [cs.AI]. 2017. 〈hal-01661184〉

Partager

Métriques

Consultations de la notice

198

Téléchargements de fichiers

27