Phonology Modelling for Expressive Speech Synthesis: a Review - Inria - Institut national de recherche en sciences et technologies du numérique Accéder directement au contenu
Rapport (Rapport De Recherche) Année : 2014

Phonology Modelling for Expressive Speech Synthesis: a Review

Résumé

Expressive speech processing is an important scientific problem as expressivity introduces a lot of variability into speech. This variability leads to a degradation of speech application performances. Variations are reflected in the linguistic, phonological and acoustic sides of speech. However our main interest is on phonology, more precisely the study of pronunciation and of disfluencies. Both of these fields have huge impacts on speech. This report is a bibliographical review of the state of the art in expressivity and phonology modelling. Although the main focus will be on speech synthesis, we will discuss works about automatic speech recognition as well because expressivity modelling in phonology is a cross-domain problem.
L'expressivité introduit beaucoup de variabilité dans la parole. Cette variabilité touche des aspects aussi linguistiques, phonologiques qu'acoustique et conduit généralement à des dégradation des applications de traitement de la parole. Ainsi, le traitement de la parole expressive est un problème important. Précisément, notre intérêt principal se porte sur l'étude la phonologie, plus précisément celle de la prononciation et des disfluences, ces deux champs ayant chacun un rôle considérable dans la parole. Ce rapport est une étude bibliographique des travaux liées à l'expressivité et à la modélisation de la phonologie. Le cadre de cette étude est principalement celui de la synthèse de la parole. Néanmois, comme la modélisation phonologique de l'expressivité est une problématique multi-domaine, nous aborderons également des travaux issus du monde de la reconnaissance automatique de la parole.
Fichier principal
Vignette du fichier
research_report.pdf (479.86 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-01021911 , version 1 (09-07-2014)

Identifiants

  • HAL Id : hal-01021911 , version 1

Citer

Raheel Qader, Gwénolé Lecorvé, Damien Lolive, Pascale Sébillot. Phonology Modelling for Expressive Speech Synthesis: a Review. [Research Report] PI-2020, IRISA, équipe EXPRESSION. 2014, 18 p., 1 column. ⟨hal-01021911⟩
470 Consultations
536 Téléchargements

Partager

Gmail Facebook X LinkedIn More