A bag-of-features framework for incremental learning of speech invariants in unsegmented audio streams

Olivier Mangin 1, * Pierre-Yves Oudeyer 1 David Filliat 1, 2
* Auteur correspondant
1 Flowers - Flowing Epigenetic Robots and Systems
Inria Bordeaux - Sud-Ouest, U2IS - Unité d'Informatique et d'Ingénierie des Systèmes
Abstract : We introduce a computational framework that allows a machine to bootstrap flexible autonomous learning of speech recognition skills. Technically, this framework shall en- able a robot to incrementally learn to recog- nize speech invariants from unsegmented au- dio streams and with no prior knowledge of phonetics. To achieve this, we import the bag-of-words/bag-of-features approach from recent research in computer vision, and adapt it to incremental developmental speech pro- cessing. We evaluate an implementation of this framework on a complex speech database.
Type de document :
Communication dans un congrès
Tenth International Conference on Epigenetic Robotics, 2010, Örenäs Slott, Sweden. 2010
Liste complète des métadonnées

https://hal.inria.fr/inria-00541802
Contributeur : Pierre Rouanet <>
Soumis le : mercredi 1 décembre 2010 - 11:41:07
Dernière modification le : mercredi 29 novembre 2017 - 15:51:15
Document(s) archivé(s) le : mercredi 2 mars 2011 - 03:00:30

Fichier

mangin.2010.eprirob.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : inria-00541802, version 1

Collections

Citation

Olivier Mangin, Pierre-Yves Oudeyer, David Filliat. A bag-of-features framework for incremental learning of speech invariants in unsegmented audio streams. Tenth International Conference on Epigenetic Robotics, 2010, Örenäs Slott, Sweden. 2010. 〈inria-00541802〉

Partager

Métriques

Consultations de la notice

333

Téléchargements de fichiers

120