Apprentissage de distance pour l'annotation d'images par plus proches voisins

Matthieu Guillaumin; Jakob Verbeek; Cordelia Schmid; Thomas Mensink

Communication Dans Un Congrès Année : 2010

Apprentissage de distance pour l'annotation d'images par plus proches voisins

(1) , (1) , (1) , (1, 2)

1
2

Matthieu Guillaumin

Fonction : Auteur

Learning and recognition in vision

Jakob Verbeek

Fonction : Auteur
PersonId : 10676
IdHAL : verbeek
ORCID : 0000-0003-1419-1816
IdRef : 180998463

Learning and recognition in vision

Cordelia Schmid

Fonction : Auteur
PersonId : 831154

Learning and recognition in vision

Thomas Mensink

Fonction : Auteur

Learning and recognition in vision

Xerox Research Centre Europe [Meylan]

Résumé

L'annotation automatique d'image est un probleme ouvert important pour la vision par ordinateur. Pour cette tache nous proposons TagProp, un modele par plus proche voisins ponderes. Celui-ci est entraine de maniere discriminative et exploite des images d'apprentissage pour predire les labels des images de test. Les poids sont calcules a partir du rang ou de la distance entre l'image et son voisin. TagProp permet l'optimisation de la distance qui definit les voisinages en maximisant la log-vraisemblance des predictions de l'ensemble d'apprentissage. Ainsi, nous pouvons regler de maniere optimale la combinaison de plusieurs similarites visuelles qui vont des histogrammes globaux de couleur aux descriptions locales de forme. Nous proposons egalement de moduler specifiquement chaque mot pour augmenter le rappel des mots rares. Nous comparons les performances des differentes variantes de notre modele a l'etat de l'art sur trois bases d'images. Sur les cinq mesures considerees, TagProp ameliore significativement l'etat de l'art.

Domaines

Apprentissage [cs.LG]

Fichier principal

GMVS10-1.pdf (1.01 Mo)

GMVS10.png (433.85 Ko)

Origine : Fichiers produits par l'(les) auteur(s)

Format : Figure, Image

Jakob Verbeek : Connectez-vous pour contacter le contributeur

https://inria.hal.science/inria-00439309

Soumis le : mardi 15 février 2011-14:24:45

Dernière modification le : jeudi 4 avril 2024-21:36:01

Archivage à long terme le : jeudi 30 mars 2017-07:00:15

Dates et versions

inria-00439309 , version 1 (25-01-2011)

inria-00439309 , version 2 (15-02-2011)

Identifiants

HAL Id : inria-00439309 , version 2

Citer

Matthieu Guillaumin, Jakob Verbeek, Cordelia Schmid, Thomas Mensink. Apprentissage de distance pour l'annotation d'images par plus proches voisins. RFIA 2010 - Reconnaissance des Formes et Intelligence Artificielle, Jan 2010, Caen, France. ⟨inria-00439309v2⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

UNIV-RENNES1 UGA CNRS INRIA IRISA LJK LJK_GI LJK_GI_LEAR INRIA2 UR1-MATH-STIC UR1-UFR-ISTIC UNIV-RENNES ANR UR1-MATH-NUM

335 Consultations

1623 Téléchargements

Apprentissage de distance pour l'annotation d'images par plus proches voisins

Résumé

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager