Apprentissage de distance pour l'annotation d'images par plus proches voisins

Matthieu Guillaumin 1 Jakob Verbeek 1 Cordelia Schmid 1 Thomas Mensink 1, 2
1 LEAR - Learning and recognition in vision
Inria Grenoble - Rhône-Alpes, LJK - Laboratoire Jean Kuntzmann, INPG - Institut National Polytechnique de Grenoble
Résumé : L'annotation automatique d'image est un probleme ouvert important pour la vision par ordinateur. Pour cette tache nous proposons TagProp, un modele par plus proche voisins ponderes. Celui-ci est entraine de maniere discriminative et exploite des images d'apprentissage pour predire les labels des images de test. Les poids sont calcules a partir du rang ou de la distance entre l'image et son voisin. TagProp permet l'optimisation de la distance qui definit les voisinages en maximisant la log-vraisemblance des predictions de l'ensemble d'apprentissage. Ainsi, nous pouvons regler de maniere optimale la combinaison de plusieurs similarites visuelles qui vont des histogrammes globaux de couleur aux descriptions locales de forme. Nous proposons egalement de moduler specifiquement chaque mot pour augmenter le rappel des mots rares. Nous comparons les performances des differentes variantes de notre modele a l'etat de l'art sur trois bases d'images. Sur les cinq mesures considerees, TagProp ameliore significativement l'etat de l'art.
Type de document :
Communication dans un congrès
RFIA 2010 - Reconnaissance des Formes et Intelligence Artificielle, Jan 2010, Caen, France. 2010
Liste complète des métadonnées


https://hal.inria.fr/inria-00439309
Contributeur : Jakob Verbeek <>
Soumis le : mardi 15 février 2011 - 14:24:45
Dernière modification le : mercredi 9 juillet 2014 - 16:41:11
Document(s) archivé(s) le : jeudi 30 mars 2017 - 07:00:15

Fichiers

GMVS10-1.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : inria-00439309, version 2

Collections

Citation

Matthieu Guillaumin, Jakob Verbeek, Cordelia Schmid, Thomas Mensink. Apprentissage de distance pour l'annotation d'images par plus proches voisins. RFIA 2010 - Reconnaissance des Formes et Intelligence Artificielle, Jan 2010, Caen, France. 2010. <inria-00439309v2>

Partager

Métriques

Consultations de
la notice

336

Téléchargements du document

2591