Phonétisation statistique adaptable d'énoncés pour le français - Inria - Institut national de recherche en sciences et technologies du numérique Accéder directement au contenu
Communication Dans Un Congrès Année : 2016

Phonétisation statistique adaptable d'énoncés pour le français

Résumé

Traditional utterance phonetization methods concatenate pronunciations of uncontextualized constituent words. This approach is too weak for some languages, like French, where transitions between words imply pronunciation modifications. Moreover, it makes it difficult to consider global pronunciation strategies, for instance to model a specific speaker or a specific accent. To overcome these problems, this paper presents a new original phonetization approach for French to generate pronunciation variants of utterances. This approach offers a statistical and highly adaptive framework by relying on conditional random fields and weighted finite state transducers. The approach is evaluated on a corpus of isolated words and a corpus of spoken utterances.
Les méthodes classiques de phonétisation d'énoncés concatènent les prononciations hors-contexte des mots. Ce type d'approches est trop faible pour certaines langues, comme le français, où les transitions entre les mots impliquent des modifications de prononciation. De plus, cela rend difficile la modélisation de stratégies de prononciation globales, par exemple pour modéliser un locuteur ou un accent particulier. Pour palier ces problèmes, ce papier présente une approche originale pour la phonétisation du français afin de générer des variantes de prononciation dans le cas d'énoncés. Par l'emploi de champs aléatoires conditionnels et de transducteurs finis pondérés, cette approche propose un cadre statistique particulièrement souple et adaptable. Cette approche est évaluée sur un corpus de mots isolés et sur un corpus d'énoncés prononcés.
Fichier principal
Vignette du fichier
jep_grumph.pdf (260.81 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-01321358 , version 1 (25-05-2016)

Identifiants

  • HAL Id : hal-01321358 , version 1

Citer

Gwénolé Lecorvé, Damien Lolive. Phonétisation statistique adaptable d'énoncés pour le français. Journées d'Études sur la Parole, Jul 2016, Paris, France. ⟨hal-01321358⟩
193 Consultations
122 Téléchargements

Partager

Gmail Facebook X LinkedIn More