Modification sélective du débit de parole - Inria - Institut national de recherche en sciences et technologies du numérique Accéder directement au contenu
Communication Dans Un Congrès Année : 2000

Modification sélective du débit de parole

Résumé

Le papier présente une méthode de transformation de la parole permettant de ralentir sélectivement son débit. Il apparaît en effet que certaines déficiences auditives (perte de sélectivité temporelle) ou l'apprentissage d'une langue étrangère peuvent nécessiter que la parole soit ralentie, et éventuellement renforcée pendant les parties transitoires. Au delà d'un simple ralentissement, il peut être intéressant d'effectuer un ralentissement sélectif, c'est-à-dire ne modifiant le débit que pour certaines parties du signal. Cela permet de renforcer l'intelligibilité sans allonger exagérément la durée du signal. Nous travaillons dans le contexte de la modification d'un signal de parole avec TD-PSOLA. Cette technique repose sur la décomposition du signal temporel en fenêtres recouvrantes synchronisées avec la fréquence fondamentale. Elle nécessite la connaissance des marques de pitch indiquant le centre des fenêtres. Nous proposons un algorithme de marquage des périodes de pitch en exploitant les résultats d'un algorithme d'extraction de la fréquence fondamentale. Ensuite nous proposons d'étendre la technique PSOLA pour un facteur de modification de débit variant dans le temps. Le mise en oeuvre du ralentissement est ensuite guidée par une stratégie de contrôle du débit de la parole. Différentes stratégies sont abordées, principalement au niveau phonétique du signal : ces méthodes peuvent nécessiter des connaissances expertes ou être complètement numériques. || This paper presents a speech signal transformation which slows down speech rate selectively. Certain hearing deficiencies (loss of temporal selectivity) or learning a foreign language may require that speech is slowed down, or even enhanced during transi

Domaines

Autre [cs.OH]
Fichier non déposé

Dates et versions

inria-00099322 , version 1 (26-09-2006)

Identifiants

  • HAL Id : inria-00099322 , version 1

Citer

Vincent Colotte, Yves Laprie. Modification sélective du débit de parole. Reconnaissance des Formes et Intelligence Artificielle - RFIA'2000, 2000, Paris, France, pp.141-148. ⟨inria-00099322⟩
179 Consultations
0 Téléchargements

Partager

Gmail Facebook X LinkedIn More