Automates lexico-phonétiques pour l'indexation et la recherche de segments de parole

Julien Fayolle 1 Fabienne Moreau 1 Christian Raymond 1 Guillaume Gravier 1
1 TEXMEX - Multimedia content-based indexing
IRISA - Institut de Recherche en Informatique et Systèmes Aléatoires, Inria Rennes – Bretagne Atlantique
Résumé : Ce papier1 présente une méthode d'indexation de segments de parole qui combine des hypothèses lexicales et phonétiques au sein d'un index hybride à base d'automates. La recherche se fait via un appariement lexico-phonétique semi-imparfait qui tolère certaines imperfections pour améliorer le rappel. Un vecteur de descripteurs, contenant des scores d'édition et une mesure de confiance, pondère chaque transition permettant de caractériser la pertinence des segments candidats pour une recherche plus précise. Les expériences montrent la complémentarité des représentations lexicales et phonétiques et leur intérêt pour rechercher des requêtes d'entités nommées.
Type de document :
Communication dans un congrès
JEP - Journées d'Études sur la Parole, Jun 2012, Grenoble, France. 1, pp.49-56, 2012
Liste complète des métadonnées

Littérature citée [10 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/hal-00742848
Contributeur : Christian Raymond <>
Soumis le : mercredi 17 octobre 2012 - 13:40:58
Dernière modification le : mercredi 16 mai 2018 - 11:23:05
Document(s) archivé(s) le : samedi 17 décembre 2016 - 02:16:36

Fichier

JEP2012.pdf
Fichiers éditeurs autorisés sur une archive ouverte

Identifiants

  • HAL Id : hal-00742848, version 1

Citation

Julien Fayolle, Fabienne Moreau, Christian Raymond, Guillaume Gravier. Automates lexico-phonétiques pour l'indexation et la recherche de segments de parole. JEP - Journées d'Études sur la Parole, Jun 2012, Grenoble, France. 1, pp.49-56, 2012. 〈hal-00742848〉

Partager

Métriques

Consultations de la notice

856

Téléchargements de fichiers

142