Apprentissage de distance pour l'annotation d'images par plus proches voisins

Matthieu Guillaumin 1 Jakob Verbeek 1 Cordelia Schmid 1 Thomas Mensink 1, 2
1 LEAR - Learning and recognition in vision
Inria Grenoble - Rhône-Alpes, LJK - Laboratoire Jean Kuntzmann, INPG - Institut National Polytechnique de Grenoble
Résumé : L'annotation automatique d'image est un probleme ouvert important pour la vision par ordinateur. Pour cette tache nous proposons TagProp, un modele par plus proche voisins ponderes. Celui-ci est entraine de maniere discriminative et exploite des images d'apprentissage pour predire les labels des images de test. Les poids sont calcules a partir du rang ou de la distance entre l'image et son voisin. TagProp permet l'optimisation de la distance qui definit les voisinages en maximisant la log-vraisemblance des predictions de l'ensemble d'apprentissage. Ainsi, nous pouvons regler de maniere optimale la combinaison de plusieurs similarites visuelles qui vont des histogrammes globaux de couleur aux descriptions locales de forme. Nous proposons egalement de moduler specifiquement chaque mot pour augmenter le rappel des mots rares. Nous comparons les performances des differentes variantes de notre modele a l'etat de l'art sur trois bases d'images. Sur les cinq mesures considerees, TagProp ameliore significativement l'etat de l'art.
Document type :
Conference papers
Complete list of metadatas


https://hal.inria.fr/inria-00439309
Contributor : Jakob Verbeek <>
Submitted on : Tuesday, February 15, 2011 - 2:24:45 PM
Last modification on : Tuesday, June 18, 2019 - 3:06:06 PM
Long-term archiving on : Thursday, March 30, 2017 - 7:00:15 AM

Files

GMVS10-1.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : inria-00439309, version 2

Collections

Citation

Matthieu Guillaumin, Jakob Verbeek, Cordelia Schmid, Thomas Mensink. Apprentissage de distance pour l'annotation d'images par plus proches voisins. RFIA 2010 - Reconnaissance des Formes et Intelligence Artificielle, Jan 2010, Caen, France. ⟨inria-00439309v2⟩

Share

Metrics

Record views

664

Files downloads

2949