Revisiting the VLAD image representation

Jonathan Delhumeau 1 Philippe-Henri Gosselin 1 Hervé Jégou 1 Patrick Pérez 2
1 TEXMEX - Multimedia content-based indexing
IRISA - Institut de Recherche en Informatique et Systèmes Aléatoires, Inria Rennes – Bretagne Atlantique
Abstract : Recent works on image retrieval have proposed to index images by compact representations encoding powerful local descriptors, such as the closely related vector of aggregated local descriptors (VLAD) and Fisher vector (FV). By combining them with a suitable coding technique, it is possible to encode an image in a few dozen bytes while achieving excellent retrieval results. This paper revisits some assumptions proposed in this context regarding the handling of ''visual burstiness'', and shows that ad-hoc choices are implicitly done which are not desirable. Focusing on VLAD without loss of generality, we propose to modify several steps of the original design. Albeit simple, these modifications significantly improve VLAD and make it compare favorably against the state of the art.
Type de document :
Communication dans un congrès
ACM Multimedia, Oct 2013, Barcelona, Spain. 2013
Liste complète des métadonnées

Littérature citée [18 références]  Voir  Masquer  Télécharger


https://hal.inria.fr/hal-00840653
Contributeur : Hervé Jégou <>
Soumis le : lundi 5 août 2013 - 22:50:17
Dernière modification le : vendredi 16 novembre 2018 - 01:22:34
Document(s) archivé(s) le : mercredi 5 avril 2017 - 19:25:20

Fichiers

nextvlad_hal.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-00840653, version 2

Citation

Jonathan Delhumeau, Philippe-Henri Gosselin, Hervé Jégou, Patrick Pérez. Revisiting the VLAD image representation. ACM Multimedia, Oct 2013, Barcelona, Spain. 2013. 〈hal-00840653v2〉

Partager

Métriques

Consultations de la notice

1100

Téléchargements de fichiers

1107