Utilisation de matrices de dissimilarité multiples pour la classification de documents

Résumé : Cet article introduit l'algorithme de classification donné dans CarvhaloLechevallier:2007:SFC capable de partitionner des objets en prenant en compte de manière simultanée plusieurs matrices de dissimilarité qui les décrivent. Ces matrices peuvent avoir été générées en utilisant différents ensembles de variables et une fonction de dissimilarité unique, un ensemble de variables donné et différentes fonctions de dissimilarité ou bien différents ensembles de variables et de fontions de dissimilarité. Cette méthode, basée sur l'algorithme de nuées dynamiques est conçu pour fournir une partition et un prototype pour chaque classe tout en découvrant une pondération pertinante pour chaque matrice de dissimilarité en optimisant un critère d'adéquation entre les classes et leurs représentants. Ces pondérations changent à chaque itération de l'algorithme et sont différentes pour chacune des classes. Ce papier se focalise sur une expérience utilisant un ensemble de documents, dont nous connaisssons une classification donnée a priori par des experts servant de référence, et montre l'utilité de cette méthode de partitionnement.
Type de document :
Communication dans un congrès
Conférence Maghrébine sur l'Extraction et la Gestion des Connaissances, Dec 2010, Alger, Algérie. 2010
Liste complète des métadonnées

https://hal.inria.fr/inria-00586210
Contributeur : Thierry Despeyroux <>
Soumis le : vendredi 15 avril 2011 - 14:04:19
Dernière modification le : vendredi 25 mai 2018 - 12:02:04
Document(s) archivé(s) le : jeudi 8 novembre 2012 - 16:36:26

Fichier

cdml.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : inria-00586210, version 1

Collections

Citation

Francisco De A. T. de Carvalho, Thierry Despeyroux, Filipe De Melo, Yves Lechevallier. Utilisation de matrices de dissimilarité multiples pour la classification de documents. Conférence Maghrébine sur l'Extraction et la Gestion des Connaissances, Dec 2010, Alger, Algérie. 2010. 〈inria-00586210〉

Partager

Métriques

Consultations de la notice

161

Téléchargements de fichiers

400