Classification non supervisée et visualisation 3D de documents

Nicolas Bonnel 1, 2 Annie Morin 2 Alexandre Cotarmanac'H 1
2 TEXMEX - Multimedia content-based indexing
IRISA - Institut de Recherche en Informatique et Systèmes Aléatoires, Inria Rennes – Bretagne Atlantique
Résumé : Le nombre de documents issus d'une requête sur le Web devient de plus en plus important. Cela nous amène à chercher des solutions pour aider l'utilisateur qui est confronté à cette masse de données. Une alternative possible à un affichage linéaire d'une liste triée selon un critère, consiste à effectuer une classification des résultats. C'est dans ce but que l'on s'intéresse aux cartes auto-organisatrices de Kohonen qui sont issues d'un algorithme de classification non supervisée. Cependant il faut ajouter des contraintes à cet algorithme afin qu'il soit adapté à la classification des résultats d'une requête. Par exemple, il doit être déterministe. De plus, la classification obtenue dépend fortement de la distance utilisée pour comparer deux documents. On évalue alors l'impact de différentes distances ou dissimilarités, afin de trouver la plus adaptée à notre problème. Un compromis doit également être trouvé entre le temps d'exécution de l'algorithme et la qualité de la classification obtenue. Pour cela, l'utilisation d'un échantillonnage est envisagée. Enfin, ces travaux sont intégrés dans un prototype qui permet de visualiser les résultats en trois dimensions et d'interagir avec eux.
Type de document :
Communication dans un congrès
5e Journées Francophones "Extraction et Gestion des Connaissances" (EGC'05), Jan 2005, Paris / France, Cépaduès-éditions, 2, pp.557-562, 2005
Liste complète des métadonnées

https://hal.inria.fr/inria-00098082
Contributeur : Nicolas Bonnel <>
Soumis le : dimanche 24 septembre 2006 - 15:02:27
Dernière modification le : mercredi 16 mai 2018 - 11:23:06
Document(s) archivé(s) le : lundi 5 avril 2010 - 23:27:43

Identifiants

  • HAL Id : inria-00098082, version 1

Citation

Nicolas Bonnel, Annie Morin, Alexandre Cotarmanac'H. Classification non supervisée et visualisation 3D de documents. 5e Journées Francophones "Extraction et Gestion des Connaissances" (EGC'05), Jan 2005, Paris / France, Cépaduès-éditions, 2, pp.557-562, 2005. 〈inria-00098082〉

Partager

Métriques

Consultations de la notice

163

Téléchargements de fichiers

228