Une pénalité floue fondée phonologiquement pour améliorer la Sélection d'Unité

David Guennec 1 Damien Lolive 1
1 EXPRESSION - Expressiveness in Human Centered Data/Media
UBS - Université de Bretagne Sud, IRISA-D6 - MEDIA ET INTERACTIONS
Résumé : Les systèmes de synthèse par corpus reposent, sauf de rares exceptions, sur des coûts cibles et des coûts de concaténation pour sélectionner la meilleure séquence d'unités. Le rôle du coût de concaténation est de s'assurer que l'assemblage de deux segments de parole ne causera l'apparition d'aucun artefact acoustique. Pour cette tâche, des distances acoustiques (MFCC, F0) sont généralement utilisées, mais dans de nombreux cas cela ne suffit pas. Dans cet article, nous introduisons une pénalité héritée du domaine de la couverture de corpus dans le coût de concaténation afin de bloquer certaines concaténations en fonction de la classe phonologique des diphones à concaténer. En outre, une seconde version faisant appel à une fonction floue est proposée pour relâcher la pénalité en fonction du positionnement du coût de concaténation par rapport à sa distribution. Une évaluation objective montre que la pénalité est efficace et amène à un meilleur classement des séquences d'unités candidates au cours de la sélection. Une évaluation subjective révèle une performance supérieure de l'approche floue.
Type de document :
Communication dans un congrès
Journées d'Études sur la Parole, Jul 2016, Paris, France
Liste complète des métadonnées

https://hal.inria.fr/hal-01338948
Contributeur : Damien Lolive <>
Soumis le : mercredi 29 juin 2016 - 13:35:23
Dernière modification le : mardi 16 janvier 2018 - 15:54:23

Identifiants

  • HAL Id : hal-01338948, version 1

Citation

David Guennec, Damien Lolive. Une pénalité floue fondée phonologiquement pour améliorer la Sélection d'Unité. Journées d'Études sur la Parole, Jul 2016, Paris, France. 〈hal-01338948〉

Partager

Métriques

Consultations de la notice

279