Détection de séquences par sélection de l'historique : application à la reconnaissance automatique de la parole

David Langlois 1 Kamel Smaïli 1 Jean-Paul Haton 1
1 PAROLE - Analysis, perception and recognition of speech
INRIA Lorraine, LORIA - Laboratoire Lorrain de Recherche en Informatique et ses Applications
Résumé : Cet article s'inscrit dans la modélisation statistique du langage pour la reconnaissance automatique de la parole. Nous présentons une méthode de détermination d'unités linguistiques de bonne qualité formées de la succession de plusieurs mots. Cette méthode utilise le principe de la Sélection par l'Historique et consiste à rechercher de fortes relations distantes entre les mots. Les nouvelles unités sont composées de mots simples de notre vocabulaire de base, qui sont fortement reliés les uns aux autres. Nous adaptons le principe des multigrammes afin de construire un modèle de langage utilisant un sous ensemble de ces nouvelles unités : les plus intéressantes en terme de modélisation statistique du langage. Le nouveau modèle bigramme utilisant ces unités améliore la perplexité du modèle de référence de 21% et accroît le taux de reconnaissance du système de reconnaissance automatique de la parole à grand vocabulaire, Sirocco, de 8,7%. Le taux d'erreur, quant à lui, est diminué de 12,7% || This paper focuses on statistical language modelling for automatic speech recognition. We present a method which aims at finding linguistic units in corpus. This method, called the Selected History Principle, consists in finding strong distant relationshi
Type de document :
Communication dans un congrès
XXIVe Journées d'Etudes sur la Parole - JEP'2002, Jun 2002, Nancy, France, pp.301, 2002
Liste complète des métadonnées

Littérature citée [11 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/inria-00107575
Contributeur : Publications Loria <>
Soumis le : jeudi 19 octobre 2006 - 09:01:57
Dernière modification le : jeudi 11 janvier 2018 - 06:19:55
Document(s) archivé(s) le : mercredi 29 mars 2017 - 13:12:19

Identifiants

  • HAL Id : inria-00107575, version 1

Collections

Citation

David Langlois, Kamel Smaïli, Jean-Paul Haton. Détection de séquences par sélection de l'historique : application à la reconnaissance automatique de la parole. XXIVe Journées d'Etudes sur la Parole - JEP'2002, Jun 2002, Nancy, France, pp.301, 2002. 〈inria-00107575〉

Partager

Métriques

Consultations de la notice

216

Téléchargements de fichiers

68