Local Features and Kernels for Classification of Texture and Object Categories: An In-Depth Study - Inria - Institut national de recherche en sciences et technologies du numérique Accéder directement au contenu
Rapport (Rapport De Recherche) Année : 2005

Local Features and Kernels for Classification of Texture and Object Categories: An In-Depth Study

Résumé

Recently, methods based on local image features have shown promise for texture and object recognition tasks. This paper presents a large-scale evaluation of an approach that represents images as distributions (signatures or histograms) of features extracted from a sparse set of keypoint locations and learns a Support Vector Machine classifier with kernels based on two effective measures for comparing distributions, the Earth Mover's Distance and the chi-square distance. We first evaluate the performance of our approach with different keypoint detectors and descriptors, as well as different kernels and classifiers. We then conduct a comparative evaluation with several state-of-the-art recognition methods on four texture and five object databases. On most of these databases, our implementation exceeds the best reported results and achieves comparable performance on the rest. Finally, we investigate the influence of background correlations on recognition performance via extensive tests on the PASCAL database, for which ground-truth object localization information is available. Our experiments demonstrate that image representations based on distributions of local features are surprisingly effective for classification of texture and object images under challenging real-world conditions, including significant intra-class variations and substantial background clutter.
Les méthodes basées sur des descripteurs d'images locaux ont récemment donné de bons résultats en reconnaissance d'objets et de textures. Cet article évalue la pertinence d'une représentation d'image par une distribution (signature, histogramme) de descripteurs calculés en des points d'intérêt, et d'une classification par Machine à Vecteur Support dont les noyaux utilisent des mesures adaptées à la comparaison de distributions (Earth Mover Distance, chi-square). Dans un premier temps nous évaluons la performance de notre approche avec différentes combinaisons de détecteurs de points d'intérêt, de descripteurs, de noyaux et de classifieurs. Puis nous comparons nos résultats avec des méthodes de l'état de l'art sur quatre bases de textures et cinq bases d'objets. Sur la plupart de ces bases, nos performances sont meilleures que celles de l'état de l'art et comparables pour le reste. Enfin, nous mesurons l'influence de la corrélation des fonds sur les performances de reconnaissance sur la base PASCAL, pour laquelle on dispose de la localisation exacte des objets. Nos expérimentations démontrent que la représentation d'images à base de distribution de descripteurs locaux est très efficace pour la classification d'objets et de textures, dans des conditions réelles telles que de fortes variations intra-classes et un fond complexe.
Fichier principal
Vignette du fichier
RR-5737.pdf (5.9 Mo) Télécharger le fichier
Vignette du fichier
00.png (334.09 Ko) Télécharger le fichier
Vignette du fichier
01.png (455.35 Ko) Télécharger le fichier
Vignette du fichier
02.png (403.92 Ko) Télécharger le fichier
Vignette du fichier
03.png (690.88 Ko) Télécharger le fichier
Vignette du fichier
04.png (535.61 Ko) Télécharger le fichier
Vignette du fichier
05.png (611.29 Ko) Télécharger le fichier
Vignette du fichier
06.png (576.72 Ko) Télécharger le fichier
Vignette du fichier
07.png (328.15 Ko) Télécharger le fichier
Vignette du fichier
08.png (48.91 Ko) Télécharger le fichier
Vignette du fichier
09.png (50.42 Ko) Télécharger le fichier
Vignette du fichier
10.png (50.62 Ko) Télécharger le fichier
Format : Figure, Image
Format : Figure, Image
Format : Figure, Image
Format : Figure, Image
Format : Figure, Image
Format : Figure, Image
Format : Figure, Image
Format : Figure, Image
Format : Figure, Image
Format : Figure, Image
Format : Figure, Image
Loading...

Dates et versions

inria-00070281 , version 1 (19-05-2006)

Identifiants

  • HAL Id : inria-00070281 , version 1

Citer

Jianguo Zhang, Marcin Marszałek, Svetlana Lazebnik, Cordelia Schmid. Local Features and Kernels for Classification of Texture and Object Categories: An In-Depth Study. [Research Report] RR-5737, INRIA. 2005, pp.39. ⟨inria-00070281⟩
2212 Consultations
1074 Téléchargements

Partager

Gmail Facebook X LinkedIn More