Construction faiblement supervisée d'un phonétiseur pour la langue Iban à partir de ressources en Malais

Résumé : Cet article décrit notre collecte de ressources pour la langue iban (parlée notamment sur l'île de Bornéo), dans l'objectif de construire un système de reconnaissance automatique de la parole pour cette langue. Nous nous sommes plus particulièrement focalisés sur une méthodologie d'amorçage du lexique phonétisé à partir d'une langue proche (le malais). Les performances des premiers systèmes de reconnaissance automatique de la parole construits pour l'iban (< 20% WER) montrent que l'utilisation d'un phonétiseur déjà disponible dans une langue proche (le malais) est une option tout à fait viable pour amorcer le développement d'un système de RAP dans une nouvelle langue très peu dotée. Une première analyse des erreurs fait ressortir des problèmes bien connus pour les langues peu dotées : problèmes de normalisation de l'orthographe, erreurs liées à la morphologie (séparation ou non des affixes de la racine).
Type de document :
Communication dans un congrès
Journées d'Etude sur la Parole (JEP), Jun 2014, Le Mans, France. 2014
Liste complète des métadonnées

Littérature citée [13 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/hal-01002921
Contributeur : Laurent Besacier <>
Soumis le : samedi 7 juin 2014 - 14:42:54
Dernière modification le : jeudi 11 janvier 2018 - 06:22:06
Document(s) archivé(s) le : dimanche 7 septembre 2014 - 10:45:49

Fichier

jep2014-sarah.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-01002921, version 1

Citation

Sarah Samson Juan, Laurent Besacier, Solange Rossato. Construction faiblement supervisée d'un phonétiseur pour la langue Iban à partir de ressources en Malais. Journées d'Etude sur la Parole (JEP), Jun 2014, Le Mans, France. 2014. 〈hal-01002921〉

Partager

Métriques

Consultations de la notice

207

Téléchargements de fichiers

162