Exploitation d'une marge de tolérance de classification pour améliorer l'apprentissage de modèles acoustiques de classes en reconnaissance de la parole

Denis Jouvet 1 Arseniy Gorin 1 Nicolas Vinuesa 1
1 PAROLE - Analysis, perception and recognition of speech
Inria Nancy - Grand Est, LORIA - NLPKD - Department of Natural Language Processing & Knowledge Discovery
Résumé : Ce papier présente la prise en compte d'une marge de tolérance lors la classification des données d'apprentissage pour la fabrication de modèles acoustiques de classes pour la transcription automatique de la parole. En effet, bien que la classification automatique des données permette d'aller au-delà de la traditionnelle partition hommes/femmes, le nombre de classes utilisables est généralement limité par la fiabilité des modèles acoustiques associés aux classes, qui malheureusement va en diminuant avec le nombre de classes. Les expériences présentées montrent que la prise en compte d'une marge de tolérance lors de la classification des données d'apprentissage permet d'accroitre la quantité des données associées à chaque classe, et donc la fiabilité des modèles acoustiques associés aux classes. Les évaluations menées sur les données de la campagne ESTER2 ont montré la possibilité de fabriquer ainsi des modèles de classes aboutissant à de meilleures performances que l'utilisation des modèles habituels spécialisés hommes/femmes.
Type de document :
Communication dans un congrès
JEP-TALN-RECITAL 2012, Jun 2012, Grenoble, France. pp.763-770, 2012, 〈http://www.aclweb.org/anthology/F/F12/F12-1096.pdf〉
Liste complète des métadonnées

https://hal.inria.fr/hal-00753394
Contributeur : Denis Jouvet <>
Soumis le : lundi 19 novembre 2012 - 11:06:49
Dernière modification le : jeudi 11 janvier 2018 - 06:25:24

Identifiants

  • HAL Id : hal-00753394, version 1

Collections

Citation

Denis Jouvet, Arseniy Gorin, Nicolas Vinuesa. Exploitation d'une marge de tolérance de classification pour améliorer l'apprentissage de modèles acoustiques de classes en reconnaissance de la parole. JEP-TALN-RECITAL 2012, Jun 2012, Grenoble, France. pp.763-770, 2012, 〈http://www.aclweb.org/anthology/F/F12/F12-1096.pdf〉. 〈hal-00753394〉

Partager

Métriques

Consultations de la notice

278