Skip to Main content Skip to Navigation
Theses

Reconnaissance Statistique de la Parole Continue pour Voix Laryngée et Alaryngée

Abstract : La Reconnaissance Automatique de la Parole (RAP) demeure depuis toujours un défi scientifique. Au cours de ces dernières années de grands efforts de recherche ont été concrétisés, afin de développer des systèmes d’aide et des solutions permettant d’effectuer certaine tâches jusqu’ici réservées aux humains. La parole est un mode de communication naturel, et un moyen facile pour échanger des informations entre humains. Une personne laryngectomisée, n’a pas la capacité de parler normalement puisqu’elle est dépourvue de ses cordes vocales suite à une ablation chirurgicale du larynx. Ainsi, le patient perd toute possibilité de communication avec une voix laryngée. Néanmoins, la rééducation avec un orthophoniste lui permet d’acquérir une voix de substitution dite “oesophagienne”. Contrairement à la parole laryngée (normale), cette parole oesophagienne (alaryngée) est rauque, faible en énergie et en intelligibilité ce qui la rend difficile à comprendre. L’objectif de cette thèse est la réalisation d’un système de reconnaissance automatique de la parole oesophagienne (alaryngée). Ce système devrait être en mesure de restituer, la plus grande partie des informations phonétiques contenues dans le signal de la parole oesophagienne. Cette information textuelle fournie par la partie décodage de ce système pourra être utilisée par un synthétiseur texte-parole (Text-To-Speech) dans le but de reconstruire une voix laryngée. Un tel système permettrait aux personnes laryngectomisées, une communication orale plus facile avec d’autres personnes. Notre première contribution est relative au développement d’un système de reconnaissance automatique de la parole laryngée en utilisant des modèles de Markov cachés. Les rares corpus de parole oesophagienne existants, ne sont pas dédiés à la reconnaissance, à cause d’un manque de données (souvent quelques dizaines de phrases sont enregistrées). Pour cette raison, nous avons conçu notre propre base de données dédiée à la reconnaissance de la parole oesophagienne contenant 480 phases prononcées par un locuteur laryngectomisé.Dans une seconde partie, le système de reconnaissance de la parole laryngée créé a été adapté et appliqué à cette parole oesophagienne. Notre dernière contribution au sujet de cette thèse concerne la réalisation d’un système hybride (correction = conversion + reconnaissance) fondé sur la conversion de la voix en projetant les vecteurs acoustiques de la parole oesophagienne dans un espace moins perturbé et relatif à la parole laryngée. Nous montrons que ce système hybride est capable d’améliorer la reconnaissance de cette parole alaryngée.
Document type :
Theses
Complete list of metadata

Cited literature [71 references]  Display  Hide  Download

https://hal.inria.fr/tel-01563766
Contributor : Joseph Di Martino <>
Submitted on : Tuesday, July 18, 2017 - 10:09:59 AM
Last modification on : Thursday, January 24, 2019 - 9:48:25 AM
Long-term archiving on: : Saturday, January 27, 2018 - 7:48:58 AM

Identifiers

  • HAL Id : tel-01563766, version 1

Collections

Citation

Othman Lachhab. Reconnaissance Statistique de la Parole Continue pour Voix Laryngée et Alaryngée. Informatique et langage [cs.CL]. Université Mohammed V de Rabat (Maroc), 2017. Français. ⟨tel-01563766⟩

Share

Metrics

Record views

1377

Files downloads

2882