Choix et adaptation de modèles statistiques pour la séparation de voix chantée à partir d'un seul microphone

Alexey Ozerov 1, 2 Pierrick Philippe 2 Rémi Gribonval 1 Frédéric Bimbot 1
1 METISS - Speech and sound data modeling and processing
IRISA - Institut de Recherche en Informatique et Systèmes Aléatoires, Inria Rennes – Bretagne Atlantique
Résumé : Le problème de l'extraction de la voix chantée dans des enregistrements musicaux monophoniques, c'est-à-dire la séparation voix / musique avec un seul capteur, est étudié. Les approches utilisées sont basées sur des modèles statistiques a priori des deux sources (musique et voix), notamment sur des Modèles de Mélange de Gaussiennes (MMG). Une méthode d'adaptation des modèles aux caractéristiques des sources mélangées est proposée, et une étude comparative des différents modèles et estimateurs est effectuée. Les résultats montrent que l'adaptation du modèle de musique sur les parties non-vocales des chansons permet d'obtenir de bonnes performances dans un cadre réaliste.
Type de document :
Article dans une revue
Traitement du Signal, Lavoisier, 2007, 24 (3), pp.211--224. 〈http://hdl.handle.net/2042/8922〉
Liste complète des métadonnées

Littérature citée [30 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/inria-00544771
Contributeur : Rémi Gribonval <>
Soumis le : mardi 8 février 2011 - 22:43:15
Dernière modification le : mercredi 16 mai 2018 - 11:23:03
Document(s) archivé(s) le : lundi 9 mai 2011 - 02:48:15

Fichier

2007_RFTS_ozerov_et_al.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : inria-00544771, version 1

Citation

Alexey Ozerov, Pierrick Philippe, Rémi Gribonval, Frédéric Bimbot. Choix et adaptation de modèles statistiques pour la séparation de voix chantée à partir d'un seul microphone. Traitement du Signal, Lavoisier, 2007, 24 (3), pp.211--224. 〈http://hdl.handle.net/2042/8922〉. 〈inria-00544771〉

Partager

Métriques

Consultations de la notice

359

Téléchargements de fichiers

144