A general framework for online audio source separation

Laurent S. R. Simon 1 Emmanuel Vincent 1
1 METISS - Speech and sound data modeling and processing
IRISA - Institut de Recherche en Informatique et Systèmes Aléatoires, Inria Rennes – Bretagne Atlantique
Abstract : We consider the problem of online audio source separation. Existing algorithms adopt either a sliding block approach or a stochastic gradient approach, which is faster but less accurate. Also, they rely either on spatial cues or on spectral cues and cannot separate certain mixtures. In this paper, we design a general online audio source separation framework that combines both approaches and both types of cues. The model parameters are estimated in the Maximum Likelihood (ML) sense using a Generalised Expectation Maximisation (GEM) algorithm with multiplicative updates. The separation performance is evaluated as a function of the block size and the step size and compared to that of an offline algorithm.
Type de document :
Communication dans un congrès
International conference on Latent Variable Analysis and Signal Separation, Mar 2012, Tel-Aviv, Israel. 2012
Liste complète des métadonnées

Littérature citée [12 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/hal-00655398
Contributeur : Laurent S. R. Simon <>
Soumis le : mercredi 28 décembre 2011 - 11:59:09
Dernière modification le : mercredi 16 mai 2018 - 11:23:03
Document(s) archivé(s) le : jeudi 29 mars 2012 - 02:20:33

Fichiers

LVA2012.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-00655398, version 1
  • ARXIV : 1112.6178

Citation

Laurent S. R. Simon, Emmanuel Vincent. A general framework for online audio source separation. International conference on Latent Variable Analysis and Signal Separation, Mar 2012, Tel-Aviv, Israel. 2012. 〈hal-00655398〉

Partager

Métriques

Consultations de la notice

373

Téléchargements de fichiers

419