Comment faire parler les images aux rayons X du conduit vocal ? - Inria - Institut national de recherche en sciences et technologies du numérique Accéder directement au contenu
Article Dans Une Revue SHS Web of Conferences Année : 2014

Comment faire parler les images aux rayons X du conduit vocal ?

Résumé

Speech production is a dynamic process which relies on the realization of articulatory gestures by the speaker. Its study thus necessitates technologies to acquire articulatory data, which often come from medical imaging. Xrays have been used until the end of last century. These data are films which require processing before being exploited. Xarticulators software was developed for this purpose and it enables the manual or automatic extraction of articulator contours. This communication presents the database collected at IPS, the protocol used to process data and the construction of articulatory models intended to approximate the vocal tract shape for vowels and consonants. We detail the improvement of the model in the cases of consonants so as to offer a good geometric precision at the place of articulation, and thus a correct acoustic signal with articulatory synthesis. This communications ends with the presentation of articulatory copy synthesis tools which enable realistic speech to be synthesized from images of an Xray film of the vocal tract.
La production de la parole est un phénomène dynamique qui repose sur la réalisation de gestes articulatoires par le locuteur. Son étude nécessite donc des moyens d'acquisition, souvent issus de l'imagerie médicale comme c'est le cas avec l'imagerie par rayons X qui a été utilisée pour construire des bases de données jusqu'à la fin du siècle dernier. Ces données se présentent sous la forme de cinéradiographies qui requièrent un dépouillement préalable à leur exploitation. Le logiciel Xarticulators a été développé à cette fin et il permet notamment d'extraire manuellement ou automatiquement les contours des articulateurs. Cette communication présente la constitution des bases de données de l'IPS, le protocole de dépouillement et la construction de modèles articulatoires destinés à approcher la forme du conduit vocal pour les voyelles et les consonnes. Nous détaillons en particulier l'amélioration du modèle dans le cas consonnes pour qu'il puisse être précis au point d'articulation et donner une acoustique correcte lors de la synthèse. Cette communication se termine avec la présentation des outils de synthèse articulatoire par copie qui permettent de synthétiser de la parole réaliste à partir des images d'un film aux rayons X du conduit vocal.

Domaines

Linguistique
Fichier principal
Vignette du fichier
rx-final.pdf (596.05 Ko) Télécharger le fichier
Origine : Fichiers éditeurs autorisés sur une archive ouverte

Dates et versions

hal-01059887 , version 1 (02-09-2014)

Identifiants

Citer

Yves Laprie, Rudolph Sock, Béatrice Vaxelaire, Benjamin Elie. Comment faire parler les images aux rayons X du conduit vocal ?. SHS Web of Conferences, 2014, 4e Congrès Mondial de Linguistique Française, 8, pp.14. ⟨10.1051/shsconf/20140801344⟩. ⟨hal-01059887⟩
370 Consultations
232 Téléchargements

Altmetric

Partager

Gmail Facebook X LinkedIn More