Exploiting descriptor distances for precise image search

Hervé Jégou 1 Matthijs Douze 2, 3 Cordelia Schmid 2
1 TEXMEX - Multimedia content-based indexing
IRISA - Institut de Recherche en Informatique et Systèmes Aléatoires, Inria Rennes – Bretagne Atlantique
2 LEAR - Learning and recognition in vision
Inria Grenoble - Rhône-Alpes, LJK - Laboratoire Jean Kuntzmann, INPG - Institut National Polytechnique de Grenoble
Résumé : Ce rapport considère le problème de la recherche d'image à partir de descripteurs locaux. Notre approche étend un système de vote par k plus proches voisins de plusieurs manières. Tout d'abord, nous introduisons un critère adaptatif, dérivé des distances associés aux plus proches voisins, afin de pondérer la qualité des appariemments. Nous exploitons ensuite les plus proches voisins réciproques et les distances associées pour améliorer la similarité entre chaque descripteur SIFT requête et ses voisins. Chacune de ces deux méthodes apporte un gain significatif par rapport à la référence du système de vote initial, et fournit des résultats supérieurs à une approche par sac-de-mots. Cependant, elle nécessite le calcul coûteux, en mémoire et en CPU, des distances et du graphe des plus proches voisins associé à la base. Afin de rendre notre méthode utilisable à une plus grande échelle, nous utilisons une méthode de recherche approximative récente qui estime les distances entre les vecteurs requêtes et ceux de la base, sans avoir à stocker en mémoire la représentation pleine de descripteurs. Nos expériences montrent que cette méthode approchée dépasse largement l'état de l'art sur 4 jeux de données couramment utilisés en recherche d'image. Bien qu'elle ne soit pas aussi efficace qu'une approche par sac-de-mots, nous montrons qu'elle reste utilisable pour une base comprenant jusqu'à 1 million d'images.
Type de document :
Rapport
[Research Report] RR-7656, INRIA. 2011
Liste complète des métadonnées

Littérature citée [28 références]  Voir  Masquer  Télécharger


https://hal.inria.fr/inria-00602325
Contributeur : Hervé Jégou <>
Soumis le : jeudi 23 juin 2011 - 00:03:19
Dernière modification le : mercredi 16 mai 2018 - 11:23:05
Document(s) archivé(s) le : dimanche 4 décembre 2016 - 20:35:31

Fichiers

RA-7656.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : inria-00602325, version 2

Citation

Hervé Jégou, Matthijs Douze, Cordelia Schmid. Exploiting descriptor distances for precise image search. [Research Report] RR-7656, INRIA. 2011. 〈inria-00602325v2〉

Partager

Métriques

Consultations de la notice

1073

Téléchargements de fichiers

1630