A Large-Scale Performance Study of Cluster-Based High-Dimensional Indexing

Gylfi Thór Gudmundsson 1 Björn Þór Jónsson 2 Laurent Amsaleg 1
1 TEXMEX - Multimedia content-based indexing
IRISA - Institut de Recherche en Informatique et Systèmes Aléatoires, Inria Rennes – Bretagne Atlantique
Résumé : Le clustering en grandes dimensions est une méthode employée par certains systèmes de recherche d'images par le contenu pour partitionner l'espace en groupes. Les groupes sont ensuite indexés pour accélérer le traitement des requêtes. Récemment, une approche dite ``Cluster Pruning'' a été proposée comme permettant l'obtention simple, rapide et efficace de ces groupes. Alors que son évaluation originale s'est effectuée dans un contexte d'indexation de textes et à une échelle réduite, sa simplicité et ses performances ont été une forte motivation pour étudier son comportement à bien plus grande échelle, et dans un contexte image. Nous menons des expérimentations où sont utilisés des descripteurs locaux d'image appartenant à l'état de l'art et de dimension 72. Nous traitons plusieurs collections de descripteurs, dont la plus grande en contient 189 millions. Cet article présente une synthèse des résultats de cette étude et montre que l'algorithme original fonctionne relativement bien. Toutefois, trois extensions simples permettent d'améliorer de manière très importante ses performances et son aptitude à passer à l'échelle, en accélérant tant le traitement des requêtes que le temps de construction des groupes. Dotée de ces extensions, l'approche ``Cluster Pruning'' devient alors une brique essentielle pouvant servir aux systèmes grande échelle nécessitant la création de groupes de points.
Type de document :
Communication dans un congrès
ACM. 18th ACM International Conference on Multimedia - Workshop on Very-Large-Scale Multimedia Corpus, Mining and Retrieval, Oct 2010, Florence, Italy. 2010, 〈http://portal.acm.org/ft_gateway.cfm?id=1878145&type=pdf&CFID=7377686&CFTOKEN=63069025〉. 〈10.1145/1878137.1878145〉
Liste complète des métadonnées

https://hal.inria.fr/inria-00560972
Contributeur : Patrick Gros <>
Soumis le : lundi 31 janvier 2011 - 13:43:45
Dernière modification le : vendredi 16 novembre 2018 - 01:22:08

Lien texte intégral

Identifiants

Citation

Gylfi Thór Gudmundsson, Björn Þór Jónsson, Laurent Amsaleg. A Large-Scale Performance Study of Cluster-Based High-Dimensional Indexing. ACM. 18th ACM International Conference on Multimedia - Workshop on Very-Large-Scale Multimedia Corpus, Mining and Retrieval, Oct 2010, Florence, Italy. 2010, 〈http://portal.acm.org/ft_gateway.cfm?id=1878145&type=pdf&CFID=7377686&CFTOKEN=63069025〉. 〈10.1145/1878137.1878145〉. 〈inria-00560972〉

Partager

Métriques

Consultations de la notice

140