Adaptation de la prononciation pour la synthèse de la parole spontanée en utilisant des informations linguistiques

Raheel Qader 1 Gwénolé Lecorvé 1 Damien Lolive 1 Pascale Sébillot 2
1 EXPRESSION - Expressiveness in Human Centered Data/Media
UBS - Université de Bretagne Sud, IRISA-D6 - MEDIA ET INTERACTIONS
2 LinkMedia - Creating and exploiting explicit links between multimedia fragments
Inria Rennes – Bretagne Atlantique , IRISA-D6 - MEDIA ET INTERACTIONS
Résumé : Cet article présente une nouvelle méthode d'adaptation de la prononciation dont le but est de reproduire le style spontané. Il s'agit d'une tâche-clé en synthèse de la parole car elle permet d'apporter de l'expressivité aux signaux produits, ouvrant ainsi la voie à de nouvelles applications. La force de la méthode proposée est de ne s'appuyer que sur des informations linguistiques et de considérer un cadre probabiliste pour ce faire, précisément les champs aléatoires conditionnels. Dans cet article, nous étudions tout d'abord la pertinence d'un ensemble d'informations pour l'adaptation, puis nous combinons les informations les plus pertinentes lors d'expériences finales. Les évaluations de la méthode sur un corpus de parole conversationnelle en anglais montrent que les prononciations adaptées reflètent significativement mieux un style spontané que les prononciations canoniques. ABSTRACT Pronunciation adaptation for spontaneous speech synthesis using linguistic information. This paper presents a new pronunciation adaptation method which adapts canonical pronunciations to a spontaneous style. This is a key task in text-to-speech as those pronunciation variants bring expressiveness to synthetic speech, thus enabling new potential applications. The strength of the method is to solely rely on linguistic features and to consider a probabilistic machine learning framework, namely conditional random fields, to produce the adapted pronunciations. Features are selected in a first series of experiments, then combined in the backend experiments. Results on the Buckeye conversational English speech corpus show that adapted pronunciations significantly better reflect spontaneous speech than canonical ones. MOTS-CLÉS : Adaptation de la prononciation, parole spontanée, synthèse de la parole.
Type de document :
Communication dans un congrès
Journées d'Études sur la Parole, Jul 2016, Paris, France
Liste complète des métadonnées

Littérature citée [16 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/hal-01321361
Contributeur : Gwénolé Lecorvé <>
Soumis le : mercredi 25 mai 2016 - 15:02:35
Dernière modification le : vendredi 1 décembre 2017 - 01:22:17
Document(s) archivé(s) le : vendredi 26 août 2016 - 10:50:41

Fichier

pronunciation_adaptation.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-01321361, version 1

Citation

Raheel Qader, Gwénolé Lecorvé, Damien Lolive, Pascale Sébillot. Adaptation de la prononciation pour la synthèse de la parole spontanée en utilisant des informations linguistiques. Journées d'Études sur la Parole, Jul 2016, Paris, France. 〈hal-01321361〉

Partager

Métriques

Consultations de la notice

581

Téléchargements de fichiers

46