Embedding Tolerance Relations in Concept Lattices - An application in Information Fusion - Inria - Institut national de recherche en sciences et technologies du numérique Accéder directement au contenu
Rapport (Rapport De Recherche) Année : 2010

Embedding Tolerance Relations in Concept Lattices - An application in Information Fusion

Résumé

Formal Concept Analysis (FCA) is a well founded mathematical framework used for conceptual classification and knowledge management. Given a binary table describing a relation between objects and attributes, FCA consists in building a set of concepts organized by a subsumption relation within a concept lattice. Accordingly, FCA requires to transform complex data, e.g. numbers, intervals, graphs, into binary data leading to loss of information and poor interpretability of object classes. In this paper, we propose a pre-processing method producing binary data from complex data taking advantage of similarity between objects. As a result, the concept lattice is composed of classes being maximal sets of pairwise similar objects. This method is based on FCA and on a formalization of similarity as a tolerance relation (reflexive and symmetric). It applies to complex object descriptions and especially here to interval data. Moreover, it can be applied to any kind of structured data for which a similarity can be defined (sequences, graphs, etc.). Finally, an application highlights that the resulting concept lattice plays an important role in information fusion problem, as illustrated with a real-world example in agronomy.
L'analyse formelle de concepts (AFC) est un formalisme mathémati- -que bien établi, utilisé pour la classification conceptuelle et l'organisation des connaissances. A partir d'une table binaire décrivant une relation entre des objets et leurs attributs, l'AFC permet de construire un ensemble de concepts organisés par une relation de subsomption, au sein d'un treillis de concepts. % Mais l'AFC a besoin de transformer les données complexes, par exemple composées de nombres, intervalles, graphes, en données binaires. Cela peut aboutir à une perte d'information et une pauvre interprétabilité des classes d'objets. % Dans ce papier, nous proposons une méthode de pré-traitement qui produit une table binaire à partir de données complexes tout en bénéficiant d'une similarité entre objets. De cette manière, le treillis de concepts est composée de classes representant des ensembles maximaux d'objets similaires deux à deux. Cette méthode est basée sur l'AFC et sur une formalisation de la similarité par une relation de tolerance (refléxive et symétrique). Cette méthode s'applique à des descriptions d'objets complexes et particulièrement dans ce papier, à des données intervalles. De plus, elle peut être appliquée à tout type de données structurées pour lesquelles une similarité peut être définie (séquences, graphes, etc.). % Pour finir, une application argumente l'utilité d'un tel treillis pour des problèmes de fusion d'information, et s'illustre sur un exemple réel en agronomie.
Fichier principal
Vignette du fichier
RR-7353.pdf (680.75 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

inria-00508462 , version 1 (03-02-2011)

Identifiants

  • HAL Id : inria-00508462 , version 1

Citer

Mehdi Kaytoue, Sergei O. Kuznetsov, Zainab Assaghir, Amedeo Napoli. Embedding Tolerance Relations in Concept Lattices - An application in Information Fusion. [Research Report] RR-7353, INRIA. 2010, pp.23. ⟨inria-00508462⟩
202 Consultations
215 Téléchargements

Partager

Gmail Facebook X LinkedIn More