Encoding Feature Maps of CNNs for Action Recognition

Xiaojiang Peng; Cordelia Schmid

Autre Publication Année : 2015

Encoding Feature Maps of CNNs for Action Recognition

(1) , (1)

Xiaojiang Peng

Fonction : Auteur

Learning and recognition in vision

Cordelia Schmid

Fonction : Auteur
PersonId : 831154

Learning and recognition in vision

Résumé

We describe our approach for action classification in the THUMOS Challenge 2015. Our approach is based on two types of features, improved dense trajectories and CNN features. For trajectory features, we extract HOG, HOF, MBHx, and MBHy descriptors and apply Fisher vector encoding. For CNN features, we utilize a recent deep CNN model, VGG19, to capture appearance features and use VLAD encoding to encode/pool convolutional feature maps which shows better performance than average pooling of feature maps and full-connected activation features. After concatenating them, we train a linear SVM classifier for each class in a one-vs-all scheme.

Domaines

Vision par ordinateur et reconnaissance de formes [cs.CV]

Fichier principal

thumos15_f2_xpeng.pdf (305.56 Ko)

Origine : Fichiers produits par l'(les) auteur(s)

THOTH Team : Connectez-vous pour contacter le contributeur

https://inria.hal.science/hal-01236843

Soumis le : jeudi 10 décembre 2015-16:43:43

Dernière modification le : jeudi 4 avril 2024-21:30:36

Archivage à long terme le : samedi 29 avril 2017-02:32:32

Dates et versions

hal-01236843 , version 1 (10-12-2015)

Identifiants

HAL Id : hal-01236843 , version 1

Citer

Xiaojiang Peng, Cordelia Schmid. Encoding Feature Maps of CNNs for Action Recognition. 2015. ⟨hal-01236843⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

UGA CNRS INRIA LJK LJK_GI LJK_GI_IMAGINE INRIA2

698 Consultations

888 Téléchargements

Encoding Feature Maps of CNNs for Action Recognition

Résumé

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager