Extraction automatique de Questions dans les corpus de réunions et de dialogues - Inria - Institut national de recherche en sciences et technologies du numérique Accéder directement au contenu
Communication Dans Un Congrès Année : 2005

Extraction automatique de Questions dans les corpus de réunions et de dialogues

Résumé

L'extraction de parties pertinentes d'un enregistrement de parole d'une réunion ou d'une conversation peut aider à réaliser le résumé automatique ou l'indexation du document audio ou audio-vidéo. Nous présentons un travail original, peu étudié dans la littérature, qui porte sur l'extraction automatique de phrases de type questions à partir d'un enregistrement audio. Dans une première démarche, nous avons développé et évalué un système d'extraction de questions qui utilise seulement des paramètres acoustiques mesurés sur le signal de parole sans utiliser les résultats d'un module de reconnaissance RAP. Les paramètres utilisés sont extraits de la courbe d'intonation et le classificateur est un arbre de décision. Nos premières expérimentations sur un corpus français de réunions nous ont permis d'obtenir un taux de classification de 75 % environ. Une deuxième phase de l'étude a été menée pour trouver le meilleur jeu de paramètres acoustiques pour cette tâche. Nous avons alors appliqué notre système sur un autre type de corpus (dialogues en langue française), ce qui a démontré que les seuls paramètres acoustiques ne sont pas suffisants et qu'il semble nécessaire d'utiliser d'autres indices, comme l'information lexicale de la sortie d'un moteur de RAP, pour améliorer la performance de détection de questions dans le discours spontané.
Fichier principal
Vignette du fichier
30.pdf (48.29 Ko) Télécharger le fichier
Loading...

Dates et versions

inria-00000739 , version 1 (15-11-2005)

Identifiants

  • HAL Id : inria-00000739 , version 1

Citer

Minh Quang Vu, Laurent Besacier, Eric Castelli, Ngoc Yen Pham. Extraction automatique de Questions dans les corpus de réunions et de dialogues. MajecSTIC 2005 : Manifestation des Jeunes Chercheurs francophones dans les domaines des STIC, IRISA – IETR – LTSI, Nov 2005, Rennes, pp.393-397. ⟨inria-00000739⟩
296 Consultations
226 Téléchargements

Partager

Gmail Facebook X LinkedIn More