Extraction automatique de Questions dans les corpus de réunions et de dialogues

Résumé : L'extraction de parties pertinentes d'un enregistrement de parole d'une réunion ou d'une conversation peut aider à réaliser le résumé automatique ou l'indexation du document audio ou audio-vidéo. Nous présentons un travail original, peu étudié dans la littérature, qui porte sur l'extraction automatique de phrases de type questions à partir d'un enregistrement audio. Dans une première démarche, nous avons développé et évalué un système d'extraction de questions qui utilise seulement des paramètres acoustiques mesurés sur le signal de parole sans utiliser les résultats d'un module de reconnaissance RAP. Les paramètres utilisés sont extraits de la courbe d'intonation et le classificateur est un arbre de décision. Nos premières expérimentations sur un corpus français de réunions nous ont permis d'obtenir un taux de classification de 75 % environ. Une deuxième phase de l'étude a été menée pour trouver le meilleur jeu de paramètres acoustiques pour cette tâche. Nous avons alors appliqué notre système sur un autre type de corpus (dialogues en langue française), ce qui a démontré que les seuls paramètres acoustiques ne sont pas suffisants et qu'il semble nécessaire d'utiliser d'autres indices, comme l'information lexicale de la sortie d'un moteur de RAP, pour améliorer la performance de détection de questions dans le discours spontané.
Document type :
Conference papers
Complete list of metadatas

Cited literature [4 references]  Display  Hide  Download

https://hal.inria.fr/inria-00000739
Contributor : Elodie Foret <>
Submitted on : Tuesday, November 15, 2005 - 3:26:50 PM
Last modification on : Monday, July 8, 2019 - 3:10:12 PM
Long-term archiving on : Friday, April 2, 2010 - 7:23:58 PM

File

Identifiers

  • HAL Id : inria-00000739, version 1

Collections

Citation

Minh Quang Vu, Laurent Besacier, Eric Castelli, Ngoc Yen Pham. Extraction automatique de Questions dans les corpus de réunions et de dialogues. MajecSTIC 2005 : Manifestation des Jeunes Chercheurs francophones dans les domaines des STIC, IRISA – IETR – LTSI, Nov 2005, Rennes, pp.393-397. ⟨inria-00000739⟩

Share

Metrics

Record views

732

Files downloads

493