Reconnaissance de parole non native fondée sur l'utilisation de confusion phonétique et de contraintes graphèmiques

Ghazi Bouselmi 1 Dominique Fohr 1 Jean-Paul Haton 1 Irina Illina 1
1 PAROLE - Analysis, perception and recognition of speech
INRIA Lorraine, LORIA - Laboratoire Lorrain de Recherche en Informatique et ses Applications
Abstract : This paper presents a fully automated approach for the recognition of non native speech based on acoustic model modification. For a native language (LM) and a spoken language (LP), pronunciation variants of the phones of LP are automatically extracted from an existing non native database. These variants are stored in a confusion matrix between phones of LP and sequences of phones of LM. This confusion concept deals with the problem of non existence of match between some LM and LP phones. The confusion matrix is then used to modify the acoustic models (HMMs) of LP phones by integrating corresponding LM phone models as alternative HMM paths. We introduce graphemic contraints in the confusion extraction process. We claim that prononciation errors may depend on the graphemes related to each phone. The modified ASR system achieved a significant improvement varying between 20.3% and 43.2% (relative) in ``sentence error rate'' and between 26.6% and 50.0% (relative) in ``word error rate''. The introduction of graphemic contraints in the phonetic confusion allowed improvements while using the word-loop grammar.
Type de document :
Communication dans un congrès
XXVIes Journées d'Etude sur la Parole - JEP'06, Jun 2006, Saint-Malo, France, 2006
Liste complète des métadonnées

Littérature citée [6 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/inria-00110495
Contributeur : Bouselmi Ghazi <>
Soumis le : samedi 9 décembre 2006 - 20:05:21
Dernière modification le : jeudi 11 janvier 2018 - 06:19:56
Document(s) archivé(s) le : mardi 6 avril 2010 - 21:16:08

Fichier

jep2006.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : inria-00110495, version 1

Collections

Citation

Ghazi Bouselmi, Dominique Fohr, Jean-Paul Haton, Irina Illina. Reconnaissance de parole non native fondée sur l'utilisation de confusion phonétique et de contraintes graphèmiques. XXVIes Journées d'Etude sur la Parole - JEP'06, Jun 2006, Saint-Malo, France, 2006. 〈inria-00110495〉

Partager

Métriques

Consultations de la notice

296

Téléchargements de fichiers

125