La phonétisation comme un problème de translittération

Vincent Claveau 1, *
* Auteur correspondant
1 TEXMEX - Multimedia content-based indexing
IRISA - Institut de Recherche en Informatique et Systèmes Aléatoires, Inria Rennes – Bretagne Atlantique
Résumé : La phonétisation est une étape essentielle pour le traitement de l'oral. Dans cet article, nous décrivons un système automatique de phonétisation de mots isolés qui est simple, portable et performant. Il repose sur une approche par apprentissage ; le système est donc construit à partir d'exemples de mots et de leur représentation phonétique. Nous utili- sons pour cela une technique d'inférence de règles de réécriture initialement développée pour la translittération et la traduction. Pour évaluer les performances de notre approche, nous avons utilisé plusieurs jeux de données couvrant différentes langues et divers alphabets phonétiques, tirés du challenge Pascal Pronalsyl. Les très bons résultats obtenus égalent ou dépassent ceux des meilleurs systèmes de l'état de l'art.
Type de document :
Communication dans un congrès
TALN - Conférence sur le traitement automatique des langues naturelles, Jun 2009, Senlis, France. 2009
Liste complète des métadonnées

Littérature citée [10 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/hal-00843982
Contributeur : Patrick Gros <>
Soumis le : vendredi 12 juillet 2013 - 15:13:18
Dernière modification le : mercredi 16 mai 2018 - 11:23:05
Document(s) archivé(s) le : lundi 14 octobre 2013 - 11:10:21

Fichier

Claveau-taln09-vf.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-00843982, version 1

Citation

Vincent Claveau. La phonétisation comme un problème de translittération. TALN - Conférence sur le traitement automatique des langues naturelles, Jun 2009, Senlis, France. 2009. 〈hal-00843982〉

Partager

Métriques

Consultations de la notice

205

Téléchargements de fichiers

333