Variational Bayesian Inference for Source Separation and Robust Feature Extraction

Kamil Adiloğlu 1 Emmanuel Vincent 2
2 MULTISPEECH - Speech Modeling for Facilitating Oral-Based Communication
Inria Nancy - Grand Est, LORIA - NLPKD - Department of Natural Language Processing & Knowledge Discovery
Résumé : Dans cet article, nous considérons le problème de l'extraction des descripteurs de chaque source dans un enregistrement audio multi-sources à l'aide d'un algorithme général de séparation de sources. La difficulté consiste à estimer l'incertitude sur les sources et à la propager aux descripteurs, afin de les estimer de façon robuste en dépit des erreurs de séparation. Les méthodes de l'état de l'art estiment l'incertitude de façon heuristique, tandis que nous proposons d'intégrer sur les paramètres de l'algorithme de séparation de sources. Nous décrivons dans ce but une méthode d'inférence variationnelle bayésienne pour l'estimation de la distribution a posteriori des sources et nous calculons ensuite l'espérance des descripteurs par propagation de l'incertitude selon la méthode d'identification des moments. Nous évaluons la précision des descripteurs en terme d'erreur quadratique moyenne et conduisons des expériences de reconnaissance du locuteur afin d'observer la performance qui en découle pour un problème réel. Dans les deux cas, la méthode proposée donne les meilleurs résultats.
Type de document :
Article dans une revue
IEEE Transactions on Audio, Speech and Language Processing, Institute of Electrical and Electronics Engineers, 2016, 〈10.1109/TASLP.2016.2583794〉
Liste complète des métadonnées

Littérature citée [61 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/hal-00726146
Contributeur : Kamil Adiloglu <>
Soumis le : vendredi 8 juillet 2016 - 09:15:56
Dernière modification le : vendredi 30 mars 2018 - 14:16:11

Fichier

double.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

Citation

Kamil Adiloğlu, Emmanuel Vincent. Variational Bayesian Inference for Source Separation and Robust Feature Extraction. IEEE Transactions on Audio, Speech and Language Processing, Institute of Electrical and Electronics Engineers, 2016, 〈10.1109/TASLP.2016.2583794〉. 〈hal-00726146v2〉

Partager

Métriques

Consultations de la notice

667

Téléchargements de fichiers

384