Génération des prononciations de noms propres à l'aide des champs aéatoires conditionnels

Irina Illina 1 Dominique Fohr 1 Denis Jouvet 1
1 PAROLE - Analysis, perception and recognition of speech
Inria Nancy - Grand Est, LORIA - NLPKD - Department of Natural Language Processing & Knowledge Discovery
Résumé : Dans cet article, nous proposons une approche de conversion graphème-phonème pour les noms propres. L'approche repose sur une méthode probabiliste : les Champs Aléatoires Conditionnels (Conditional Random Fields, CRF). Les CRFs donnent une prévision à long terme, n'exigent pas l'indépendance des observations et permettent l'intégration de tags. Dans nos travaux antérieurs, l'approche de conversion graphème-phonème utilisant les CRFs a été proposée pour les mots communs et différents paramétrages des CRFs ont été étudiés. Dans cet article, nous étendons ce travail aux noms propres. Par ailleurs, nous proposons un algorithme pour la détection de l'origine des noms propres. Le système proposé est validé sur deux dictionnaires de prononciations. Notre approche se compare favorablement aux JMM (Joint-Multigram Model, système de l'état de l'art), et tire profit de la connaissance de la langue d'origine du nom propre.
Type de document :
Communication dans un congrès
JEP-TALN-RECITAL 2012, Jun 2012, Grenoble, France. 2012, 〈http://www.aclweb.org/anthology/F/F12/F12-1081.pdf〉
Liste complète des métadonnées

https://hal.inria.fr/hal-00753381
Contributeur : Denis Jouvet <>
Soumis le : lundi 19 novembre 2012 - 10:46:16
Dernière modification le : jeudi 11 janvier 2018 - 06:25:24

Identifiants

  • HAL Id : hal-00753381, version 1

Collections

Citation

Irina Illina, Dominique Fohr, Denis Jouvet. Génération des prononciations de noms propres à l'aide des champs aéatoires conditionnels. JEP-TALN-RECITAL 2012, Jun 2012, Grenoble, France. 2012, 〈http://www.aclweb.org/anthology/F/F12/F12-1081.pdf〉. 〈hal-00753381〉

Partager

Métriques

Consultations de la notice

158