Approche par patrons linguistiques pour la détection automatique du locuteur : application à l'indexation par le contenu des journaux télévisés

Mbarek Charhad 1 Georges Quénot 2
2 MRIM - Modélisation et Recherche d’Information Multimédia [Grenoble]
LIG - Laboratoire d'Informatique de Grenoble, Inria - Institut National de Recherche en Informatique et en Automatique
Résumé : L'identité des personnes dans les documents audiovisuels représente une information sémantique importante pour un processus d'indexation et de recherche par le contenu. La tâche de détection de l'identité des locuteurs peut être réalisée en exploitant des éléments d'informations issues de différentes modalités (texte, image et son). Dans cet article, nous proposons une approche pour l'indexation de l'identité des locuteurs dans les journaux télévisés en exploitant le contenu audio. Après une phase de segmentation en locuteurs, une identité est attribuée à des segments de parole par l'intermédiaire de patrons linguistiques appliqués à leur transcription produite par reconnaissance vocale. Trois types de patrons sont utilisés pour prédire l'identité du locuteur dans les segments précédents, courants ou suivants. Ces prédictions sont ensuite propagées à d'autres segments par similarité au niveau acoustique. Des évaluations ont été menées sur une partie du corpus TREC 2003 : une identité de locuteur a pu être attribuée à 53% du corpus annoté avec une précision de 82%.
Type de document :
Communication dans un congrès
Compression et Représentation des Signaux Audiovisuels (CORESA'05), 2005, Rennes, 2005
Liste complète des métadonnées

https://hal.inria.fr/hal-00954057
Contributeur : Marie-Christine Fauvet <>
Soumis le : lundi 3 mars 2014 - 12:10:17
Dernière modification le : jeudi 11 janvier 2018 - 06:22:06
Document(s) archivé(s) le : samedi 31 mai 2014 - 10:53:35

Fichier

CORESA-05.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-00954057, version 1

Collections

Citation

Mbarek Charhad, Georges Quénot. Approche par patrons linguistiques pour la détection automatique du locuteur : application à l'indexation par le contenu des journaux télévisés. Compression et Représentation des Signaux Audiovisuels (CORESA'05), 2005, Rennes, 2005. 〈hal-00954057〉

Partager

Métriques

Consultations de la notice

133

Téléchargements de fichiers

89