Représentation compacte des sacs de mots pour l'indexation d'images - Inria - Institut national de recherche en sciences et technologies du numérique Accéder directement au contenu
Communication Dans Un Congrès Année : 2010

Représentation compacte des sacs de mots pour l'indexation d'images

Hervé Jégou
  • Fonction : Auteur
  • PersonId : 833473
Matthijs Douze
  • Fonction : Auteur
  • PersonId : 843109
Cordelia Schmid
  • Fonction : Auteur
  • PersonId : 831154

Résumé

One of the main limitations of image search based on bag-of-features is the memory usage per image. Only a few million images can be handled on a single machine in reasonable response time. In this paper, we first evaluate how the memory usage is reduced by using lossless index compression. We then propose an approximate representation of bag-of-features obtained by projecting the corresponding histogram onto a set of pre-defined sparse projection functions, producing several image descriptors. Coupled with a proper indexing structure, an image is represented by a few hundred bytes. A distance expectation criterion is then used to rank the images. Our method is at least one order of magnitude faster than standard bag-of-features while providing excellent search quality
La représentation des images par descripteurs locaux est invariante à de nombreuses transformations. Une de ses principales limitations est la quantité de mémoire requise pour décrire chaque image. Une représentation de type sac de mots est ainsi limitée à quelques millions d'images pour un serveur raisonnablement équipé. Dans cet article, nous étudions la possibilité de compresser et indexer conjointement les représentations sacs de mots, et introduisons une méthode de recherche approximative sur ce type de vecteurs creux. La comparaison entre deux images consiste à calculer une espérance de distance de Hamming entre leur représentations. Nos expériences montrent que l'approche proposée requiert dix à cent fois moins de mémoire que la représentation initiale et améliore l'efficacité de la recherche, tout en offrant une qualité de recherche comparable.
Fichier principal
Vignette du fichier
jegou_rfia2010.pdf (2.04 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

inria-00548638 , version 1 (20-12-2010)

Identifiants

  • HAL Id : inria-00548638 , version 1

Citer

Hervé Jégou, Matthijs Douze, Cordelia Schmid. Représentation compacte des sacs de mots pour l'indexation d'images. RFIA 2010 - Reconnaissance des Formes et Intelligence Artificielle, Université de Caen Basse-Normandie, Jan 2010, Caen, France. ⟨inria-00548638⟩
475 Consultations
697 Téléchargements

Partager

Gmail Facebook X LinkedIn More