Modification sélective du débit de parole

Vincent Colotte 1 Yves Laprie 1
1 PAROLE - Analysis, perception and recognition of speech
INRIA Lorraine, LORIA - Laboratoire Lorrain de Recherche en Informatique et ses Applications
Résumé : Le papier présente une méthode de transformation de la parole permettant de ralentir sélectivement son débit. Il apparaît en effet que certaines déficiences auditives (perte de sélectivité temporelle) ou l'apprentissage d'une langue étrangère peuvent nécessiter que la parole soit ralentie, et éventuellement renforcée pendant les parties transitoires. Au delà d'un simple ralentissement, il peut être intéressant d'effectuer un ralentissement sélectif, c'est-à-dire ne modifiant le débit que pour certaines parties du signal. Cela permet de renforcer l'intelligibilité sans allonger exagérément la durée du signal. Nous travaillons dans le contexte de la modification d'un signal de parole avec TD-PSOLA. Cette technique repose sur la décomposition du signal temporel en fenêtres recouvrantes synchronisées avec la fréquence fondamentale. Elle nécessite la connaissance des marques de pitch indiquant le centre des fenêtres. Nous proposons un algorithme de marquage des périodes de pitch en exploitant les résultats d'un algorithme d'extraction de la fréquence fondamentale. Ensuite nous proposons d'étendre la technique PSOLA pour un facteur de modification de débit variant dans le temps. Le mise en oeuvre du ralentissement est ensuite guidée par une stratégie de contrôle du débit de la parole. Différentes stratégies sont abordées, principalement au niveau phonétique du signal : ces méthodes peuvent nécessiter des connaissances expertes ou être complètement numériques. || This paper presents a speech signal transformation which slows down speech rate selectively. Certain hearing deficiencies (loss of temporal selectivity) or learning a foreign language may require that speech is slowed down, or even enhanced during transi
Type de document :
Communication dans un congrès
Reconnaissance des Formes et Intelligence Artificielle - RFIA'2000, 2000, Paris, France, 2, pp.141-148, 2000
Liste complète des métadonnées

https://hal.inria.fr/inria-00099322
Contributeur : Publications Loria <>
Soumis le : mardi 26 septembre 2006 - 08:52:46
Dernière modification le : jeudi 11 janvier 2018 - 06:19:57

Identifiants

  • HAL Id : inria-00099322, version 1

Collections

Citation

Vincent Colotte, Yves Laprie. Modification sélective du débit de parole. Reconnaissance des Formes et Intelligence Artificielle - RFIA'2000, 2000, Paris, France, 2, pp.141-148, 2000. 〈inria-00099322〉

Partager

Métriques

Consultations de la notice

288