Séparation de sources à partir d'un seul capteur pour la reconnaissance robuste de la parole

Guillaume Gravier 1 Laurent Benaroya 1 Alexey Ozerov 1 Rémi Gribonval 1 Frédéric Bimbot 1
1 METISS - Speech and sound data modeling and processing
IRISA - Institut de Recherche en Informatique et Systèmes Aléatoires, Inria Rennes – Bretagne Atlantique
Abstract : In this paper, we address the problem of noise compensation in speech signals for robust speech recognition. Several classical denoising methods in the field of speech and signal processing are compared on speech corrupted by music, as it is often the case in broadcast news transcription tasks. We also present two new source separation techniques, namely adaptive Wiener filtering and adaptive shrinkage. These techniques rely on the use of a dictionary of spectral shapes in order to tackle the problem of non stationarity of the signals. The algorithms are first compared on the source separation task and assessed in terms of average distortion. Their effect on the entire transcription system is eventually compared in terms of word error rate. Results show that the proposed adaptive Wiener filter approach yields a significant improvement of the transcription accuracy at signal/noise ratios greater than 15 dB.
Type de document :
Communication dans un congrès
Bel, Bernard and Marlien, Isabelle. Journées d'Etude sur la Parole: JEP 2004, Apr 2004, Fès, Maroc. Université de Provence, Aix-Marseille 1. Laboratoire Parole et langage., 2004, 〈http://aune.lpl.univ-aix.fr/jep-taln04/proceed/actes/jep.htm〉
Liste complète des métadonnées

Littérature citée [10 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/inria-00567339
Contributeur : Rémi Gribonval <>
Soumis le : dimanche 20 février 2011 - 21:23:21
Dernière modification le : mercredi 11 avril 2018 - 01:51:33
Document(s) archivé(s) le : samedi 21 mai 2011 - 02:43:51

Fichier

JEP_gravier.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : inria-00567339, version 1

Citation

Guillaume Gravier, Laurent Benaroya, Alexey Ozerov, Rémi Gribonval, Frédéric Bimbot. Séparation de sources à partir d'un seul capteur pour la reconnaissance robuste de la parole. Bel, Bernard and Marlien, Isabelle. Journées d'Etude sur la Parole: JEP 2004, Apr 2004, Fès, Maroc. Université de Provence, Aix-Marseille 1. Laboratoire Parole et langage., 2004, 〈http://aune.lpl.univ-aix.fr/jep-taln04/proceed/actes/jep.htm〉. 〈inria-00567339〉

Partager

Métriques

Consultations de la notice

551

Téléchargements de fichiers

221