Introduction d’informations sémantiques dans un système de reconnaissance de la parole - Inria - Institut national de recherche en sciences et technologies du numérique Accéder directement au contenu
Communication Dans Un Congrès Année : 2020

Introduction d’informations sémantiques dans un système de reconnaissance de la parole

Résumé

Malgré les avancés spectaculaires ces dernières années, les systèmes de Reconnaissance Automatique de Parole (RAP) commettent encore des erreurs, surtout dans des environnements bruités. Pour améliorer la RAP, nous proposons de se diriger vers une contextualisation d’un système RAP, car les informations sémantiques sont importantes pour la performance de la RAP. Les systèmes RAP actuels ne prennent en compte principalement que les informations lexicales et syntaxiques. Pour modéliser les informations sémantiques, nous proposons de détecter les mots de la phrase traitée qui pourraient avoir été mal reconnus et de proposer des mots correspondant mieux au contexte. Cette analyse sémantique permettra de réévaluer les N meilleures hypothèses de transcription (N-best). Nous utilisons les embeddings Word2Vec et BERT. Nous avons évalué notre méthodologie sur le corpus des conférences TED (TED-LIUM). Les résultats montrent une amélioration significative du taux d’erreur mots en utilisant la méthodologie proposée.
Fichier principal
Vignette du fichier
35.pdf (311.4 Ko) Télécharger le fichier
Origine : Fichiers éditeurs autorisés sur une archive ouverte

Dates et versions

hal-02798559 , version 1 (07-06-2020)
hal-02798559 , version 2 (18-06-2020)
hal-02798559 , version 3 (23-06-2020)

Identifiants

  • HAL Id : hal-02798559 , version 3

Citer

Stephane Level, Irina Illina, Dominique Fohr. Introduction d’informations sémantiques dans un système de reconnaissance de la parole. 6e conférence conjointe Journées d'Études sur la Parole (JEP, 33e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition). Volume 1 : Journées d'Études sur la Parole, Jun 2020, Nancy, France. pp.362-369. ⟨hal-02798559v3⟩
139 Consultations
145 Téléchargements

Partager

Gmail Facebook X LinkedIn More