Learning the Direction of a Sound Source Using Head Motions and Spectral Features

Antoine Deleforge 1 Radu Horaud 1
1 PERCEPTION - Interpretation and Modelling of Images and Videos
Inria Grenoble - Rhône-Alpes, LJK - Laboratoire Jean Kuntzmann, INPG - Institut National Polytechnique de Grenoble
Résumé : Dans ce papier, nous abordons le problème de la localization sonore en combinant les caractéristiques spectrales monaurales et binaurales des sons à des mouvements de tête. Partant de nombreuses observations psychophysiques et comportementales suggérant que le problème de l'audition spatiale est à la fois dynamique et dépendante du sujet, nous proposons d'envisager le problème par le biais de l'apprentissage non-supervisé. Plus précisément, notre méthode permet de retrouver une paramétrisation intrinsèque en basse dimension à partir d'une représentation spectrale en haute dimension des données acoustiques. Nous traitons à la fois la localisation binaurale et monaurale, avec des indices statiques ou dynamiques. Nous montrons que les représentations en basse dimension obtenues sont homéomorphiques à la variété bidimensionelle associée aux états moteurs d'une tête robotique dôtée de deux degrées de libertée rotationels. Nous décrivons l'installation et les protocols expérimentaux qui nous ont permis de réunir un ensemble de données acoustiques, précisément annotées à la fois par la direction émeteur-récepteur et les mouvements de têtes. Nous validons notre méthode par des expériences approffondies consistant à classifier les vecteurs acoustiques d'un ensemble test, en se servant d'une variété apprise à partir d'un ensemble d'entraînement différent. Notre méthode contraste fortement avec les approches actuelles en localisation sonore car elle met en avant le rôle de l'apprentissage.
Type de document :
Rapport
[Research Report] RR-7529, INRIA. 2011, pp.29
Liste complète des métadonnées

Littérature citée [40 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/inria-00564708
Contributeur : Antoine Deleforge <>
Soumis le : mercredi 9 février 2011 - 16:56:32
Dernière modification le : mercredi 11 avril 2018 - 01:58:54
Document(s) archivé(s) le : mardi 6 novembre 2012 - 13:46:00

Fichier

RR-7529.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : inria-00564708, version 1

Collections

Citation

Antoine Deleforge, Radu Horaud. Learning the Direction of a Sound Source Using Head Motions and Spectral Features. [Research Report] RR-7529, INRIA. 2011, pp.29. 〈inria-00564708〉

Partager

Métriques

Consultations de la notice

746

Téléchargements de fichiers

301