Skip to Main content Skip to Navigation
Conference papers

Approche par patrons linguistiques pour la détection automatique du locuteur : application à l'indexation par le contenu des journaux télévisés

Résumé : L'identité des personnes dans les documents audiovisuels représente une information sémantique importante pour un processus d'indexation et de recherche par le contenu. La tâche de détection de l'identité des locuteurs peut être réalisée en exploitant des éléments d'informations issues de différentes modalités (texte, image et son). Dans cet article, nous proposons une approche pour l'indexation de l'identité des locuteurs dans les journaux télévisés en exploitant le contenu audio. Après une phase de segmentation en locuteurs, une identité est attribuée à des segments de parole par l'intermédiaire de patrons linguistiques appliqués à leur transcription produite par reconnaissance vocale. Trois types de patrons sont utilisés pour prédire l'identité du locuteur dans les segments précédents, courants ou suivants. Ces prédictions sont ensuite propagées à d'autres segments par similarité au niveau acoustique. Des évaluations ont été menées sur une partie du corpus TREC 2003 : une identité de locuteur a pu être attribuée à 53% du corpus annoté avec une précision de 82%.
Document type :
Conference papers
Complete list of metadata

https://hal.inria.fr/hal-00954057
Contributor : Marie-Christine Fauvet <>
Submitted on : Monday, March 3, 2014 - 12:10:17 PM
Last modification on : Tuesday, December 8, 2020 - 10:42:35 AM
Long-term archiving on: : Saturday, May 31, 2014 - 10:53:35 AM

File

CORESA-05.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : hal-00954057, version 1

Collections

Citation

Mbarek Charhad, Georges Quénot. Approche par patrons linguistiques pour la détection automatique du locuteur : application à l'indexation par le contenu des journaux télévisés. Compression et Représentation des Signaux Audiovisuels (CORESA'05), 2005, Rennes. ⟨hal-00954057⟩

Share

Metrics

Record views

318

Files downloads

139