Fusion de multi-modalités et réduction par sémantique latente Application à la recherche de documents multimédia et à l'annotation automatique d'images

Trong-Ton Pham 1 Jean-Pierre Chevallet 1 Joo-Hwee Lim 2, 3
1 MRIM - Modélisation et Recherche d’Information Multimédia [Grenoble]
LIG - Laboratoire d'Informatique de Grenoble, Inria - Institut National de Recherche en Informatique et en Automatique
Résumé : Ce papier étudie la "sémantique latente" entre des éléments visuels et textuels d'une collection multimédia, appliquée à deux tâches : (1) la Recherche de Document Multimédia (RDM) contenant des images et du texte ; et (2) l'Annotation Automatique d'Images (AAI). La sémantique latente, habituellement utilisée dans l'indexation textuelle, est mise à profit ici pour faire apparaître des liens entre les descriptions textuelles et visuelles des images. Nous avons ainsi deux contributions principales. Il s'agit d'une part, de la première étude sur l'influence de la sémantique latente entre termes textuels et visuels, sur une grande collection de documents. En effet, cette méthode est testée sur une collection de 20000 images touristiques. D'autre part, nous démontrons que la fusion des différents modalités d'image (i.e. termes visuels vs textuels, et différentes méthode de représentations d'image) améliore le résultat d'une annotation au- tomatique des images par du texte. Nos collections de test sont la base d'images annotées de COREL et la base d'Image CLEF 2006.
Type de document :
Communication dans un congrès
CORIA, 2008, Tregastel, France. 2008
Liste complète des métadonnées

Littérature citée [11 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/hal-00954029
Contributeur : Marie-Christine Fauvet <>
Soumis le : vendredi 28 février 2014 - 16:09:40
Dernière modification le : mercredi 7 novembre 2018 - 13:32:03
Document(s) archivé(s) le : mercredi 28 mai 2014 - 18:00:10

Fichier

39.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-00954029, version 1

Collections

Citation

Trong-Ton Pham, Jean-Pierre Chevallet, Joo-Hwee Lim. Fusion de multi-modalités et réduction par sémantique latente Application à la recherche de documents multimédia et à l'annotation automatique d'images. CORIA, 2008, Tregastel, France. 2008. 〈hal-00954029〉

Partager

Métriques

Consultations de la notice

390

Téléchargements de fichiers

177