Automates lexico-phonétiques pour l'indexation et la recherche de segments de parole - Inria - Institut national de recherche en sciences et technologies du numérique Accéder directement au contenu
Communication Dans Un Congrès Année : 2012

Automates lexico-phonétiques pour l'indexation et la recherche de segments de parole

Julien Fayolle
  • Fonction : Auteur
  • PersonId : 889121
Fabienne Moreau
Christian Raymond
Guillaume Gravier

Résumé

This paper presents a method for indexing spoken utterances which combines lexical and phonetic hypotheses in a hybrid index built from automata. The retrieval is realized by a lexical-phonetic and semi-imperfect matching whose aim is to improve the recall. A feature vector, containing edit distance scores and a confidence measure, weights each transition to help the filtering of the candidate utterance list for a more precise search. Experiment results show that the lexical and phonetic representations are complementary and we compare the hybrid search with the state-of-the-art cascaded search to retrieve named entity queries.
Ce papier1 présente une méthode d'indexation de segments de parole qui combine des hypothèses lexicales et phonétiques au sein d'un index hybride à base d'automates. La recherche se fait via un appariement lexico-phonétique semi-imparfait qui tolère certaines imperfections pour améliorer le rappel. Un vecteur de descripteurs, contenant des scores d'édition et une mesure de confiance, pondère chaque transition permettant de caractériser la pertinence des segments candidats pour une recherche plus précise. Les expériences montrent la complémentarité des représentations lexicales et phonétiques et leur intérêt pour rechercher des requêtes d'entités nommées.
Fichier principal
Vignette du fichier
JEP2012.pdf (510.42 Ko) Télécharger le fichier
Origine : Fichiers éditeurs autorisés sur une archive ouverte
Loading...

Dates et versions

hal-00742848 , version 1 (17-10-2012)

Identifiants

  • HAL Id : hal-00742848 , version 1

Citer

Julien Fayolle, Fabienne Moreau, Christian Raymond, Guillaume Gravier. Automates lexico-phonétiques pour l'indexation et la recherche de segments de parole. JEP - Journées d'Études sur la Parole, Jun 2012, Grenoble, France. pp.49-56. ⟨hal-00742848⟩
252 Consultations
118 Téléchargements

Partager

Gmail Facebook X LinkedIn More