Elaboración de un Corpus Balanceado para el Cálculo de Modelos Acústicos usando la Web
Résumé
En este artículo presentamos una metodología para la elaboración de un corpus balanceado fonéticamente para el español mexicano. Este corpus será utilizado para el entrenamiento y evaluación de modelos acústi-cos indispensables en el proceso de reconocimiento del habla. En la primera parte de este artículo se expli-ca la motivación de este trabajo. Posteriormente, se explica el método utilizado y una serie de considera-ciones en particular para el lenguaje español. Por últi-mo, se describen las características del corpus obteni-do y se compara su distribución fonética con otros estudios del lenguaje español tanto latinoamericano como ibérico.
Domaines
Informatique et langage [cs.CL]
Origine : Fichiers produits par l'(les) auteur(s)