Skip to Main content Skip to Navigation
Journal articles

Choix et adaptation de modèles statistiques pour la séparation de voix chantée à partir d'un seul microphone

Alexey Ozerov 1, 2 Pierrick Philippe 2 Rémi Gribonval 1 Frédéric Bimbot 1
1 METISS - Speech and sound data modeling and processing
IRISA - Institut de Recherche en Informatique et Systèmes Aléatoires, Inria Rennes – Bretagne Atlantique
Résumé : Le problème de l'extraction de la voix chantée dans des enregistrements musicaux monophoniques, c'est-à-dire la séparation voix / musique avec un seul capteur, est étudié. Les approches utilisées sont basées sur des modèles statistiques a priori des deux sources (musique et voix), notamment sur des Modèles de Mélange de Gaussiennes (MMG). Une méthode d'adaptation des modèles aux caractéristiques des sources mélangées est proposée, et une étude comparative des différents modèles et estimateurs est effectuée. Les résultats montrent que l'adaptation du modèle de musique sur les parties non-vocales des chansons permet d'obtenir de bonnes performances dans un cadre réaliste.
Complete list of metadata

Cited literature [30 references]  Display  Hide  Download

https://hal.inria.fr/inria-00544771
Contributor : Rémi Gribonval <>
Submitted on : Tuesday, February 8, 2011 - 10:43:15 PM
Last modification on : Tuesday, June 15, 2021 - 4:26:39 PM
Long-term archiving on: : Monday, May 9, 2011 - 2:48:15 AM

File

2007_RFTS_ozerov_et_al.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : inria-00544771, version 1

Citation

Alexey Ozerov, Pierrick Philippe, Rémi Gribonval, Frédéric Bimbot. Choix et adaptation de modèles statistiques pour la séparation de voix chantée à partir d'un seul microphone. Traitement du Signal, Lavoisier, 2007, 24 (3), pp.211--224. ⟨inria-00544771⟩

Share

Metrics

Record views

410

Files downloads

204