Adjonction de contraintes visuelles pour l'inversion acoustique-articulatoire

Yves Laprie 1 Blaise Potard 1
1 PAROLE - Analysis, perception and recognition of speech
INRIA Lorraine, LORIA - Laboratoire Lorrain de Recherche en Informatique et ses Applications
Abstract : The goal of this work is to investigate audiovisual-to-articulatory inversion. It is well established that acoustic-to-articulatory inversion is an under-determined problem. On the other hand, there is strong evidence that human speakers/listeners exploit the multimodality of speech, and more particularly the articulatory cues : the view of visible articulators, i.e. jaw and lips, improves speech intelligibility. It is thus interesting to add constraints provided by the direct visual observation of the speaker's face. Visible data were obtained by stereo-vision and enable the 3D recovery of jaw and lip movements. These data were processed to fit the nature of parameters of Maeda's articulatory model. Inversion experiments show that constraints on visible articulatory parameters enable relevant articulatory trajectories to be recovered and substantially reduce time required to explore the articulatory codebook.
Type de document :
Communication dans un congrès
Journées d'Études sur la Parole - JEP 2006, Jun 2006, Dinard/France, 2006
Liste complète des métadonnées

Littérature citée [11 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/inria-00112219
Contributeur : Blaise Potard <>
Soumis le : mardi 7 novembre 2006 - 18:56:21
Dernière modification le : jeudi 11 janvier 2018 - 06:19:56
Document(s) archivé(s) le : mardi 6 avril 2010 - 21:49:52

Fichier

Identifiants

  • HAL Id : inria-00112219, version 1

Collections

Citation

Yves Laprie, Blaise Potard. Adjonction de contraintes visuelles pour l'inversion acoustique-articulatoire. Journées d'Études sur la Parole - JEP 2006, Jun 2006, Dinard/France, 2006. 〈inria-00112219〉

Partager

Métriques

Consultations de la notice

235

Téléchargements de fichiers

107