Etude de la performance des modèles acoustiques pour des voix de personnes âgées en vue de l'adaptation des systèmes de RAP (Assessment of the acoustic models performance in the ageing voice case for ASR system adaptation) [in French]

Our study concerns the integration of an automatic speech recognition system in a social inclusion product designed for elderly people. Due to voice change with age, speech recognition systems present higher word error rate when speech is uttered by elderly speakers compared to when non-aged voice is considered. To characterise these differences in speech recognition performance, we studied which phonemes lead to the lowest recognition rate in the elderly speakers with respect to the younger ones and we collected a specific corpus to make the adaptation of the acoustic models possible. The results show that some phonemes (such as plosives) are more specifically affected by age than others. Finally, the corpus was used to adapt the ASR to the elderly population which resulted in a 5% decrease of the word error rate.

Notre étude s'inscrit dans le cadre de l'intégration d'un système de reconnaissance de la parole pour un produit de télélien social pour personnes âgées. Du fait de l'évolution des caractéristiques acoustiques de la voix en fonction de l'âge, les taux d'erreurs de mots des systèmes de reconnais- sance automatique de la parole sont plus élevés lors du décodage de parole pour des personnes âgées que non-âgées. Notre étude consiste à caractériser les différences de comportement d'un système de reconnaissance pour les personnes âgées et non-âgées, définir les phonèmes les moins bien reconnus, et recueillir un corpus spécifique pour permettre l'adaptation des modèles acoustiques à la voix âgée. Les résultats montrent que certains phonèmes tels que les plosives sont plus spécifiquement affectés par l'âge, et que le recueil des données ciblées permet de procéder à une adaptation à la voix âgée qui diminue de 5% le taux d'erreurs de mots.

Mots clés

reconnaissance automatique de parole voix des personnes âgées adaptation acoustique régression linéaire du maximum de vraisemblance

Domaines

Intelligence artificielle [cs.AI]

Fichier principal

F12-1089.pdf (64.62 Ko)

Origine : Fichiers produits par l'(les) auteur(s)

Michel Vacher : Connectez-vous pour contacter le contributeur

https://inria.hal.science/hal-00953510

Soumis le : lundi 3 mars 2014-17:58:55

Dernière modification le : jeudi 4 avril 2024-21:28:40

Archivage à long terme le : samedi 31 mai 2014-10:46:42

Dates et versions

hal-00953510 , version 1 (03-03-2014)

Identifiants

HAL Id : hal-00953510 , version 1

Citer

Frédéric Aman, Michel Vacher, Solange Rossato, Remus Dugheanu, François Portet, et al.. Etude de la performance des modèles acoustiques pour des voix de personnes âgées en vue de l'adaptation des systèmes de RAP (Assessment of the acoustic models performance in the ageing voice case for ASR system adaptation) [in French]. Actes de la conférence conjointe JEP-TALN-RECITAL 2012, volume 1: JEP, Jun 2012, Grenoble, France. pp.707--714. ⟨hal-00953510⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

UGA CNRS LIG LIG_TDCGE LIG_TDCGE_GETALP LIG_SIDCH

169 Consultations

239 Téléchargements