Choix et adaptation de modèles statistiques pour la séparation de voix chantée à partir d'un seul microphone

Alexey Ozerov; Pierrick Philippe; Rémi Gribonval; Frédéric Bimbot

Article Dans Une Revue Traitement du Signal Année : 2007

Choix et adaptation de modèles statistiques pour la séparation de voix chantée à partir d'un seul microphone

(1, 2) , (2) , (1) , (1)

1
2

Alexey Ozerov

Fonction : Auteur
PersonId : 882775

Speech and sound data modeling and processing

Orange Labs R&D [Rennes]

Pierrick Philippe

Fonction : Auteur

Orange Labs R&D [Rennes]

Rémi Gribonval

Fonction : Auteur
PersonId : 1255
IdHAL : remi-gribonval
ORCID : 0000-0002-9450-8125
IdRef : 113181590

Speech and sound data modeling and processing

Frédéric Bimbot

Fonction : Auteur
PersonId : 830967

Speech and sound data modeling and processing

Résumé

Le problème de l'extraction de la voix chantée dans des enregistrements musicaux monophoniques, c'est-à-dire la séparation voix / musique avec un seul capteur, est étudié. Les approches utilisées sont basées sur des modèles statistiques a priori des deux sources (musique et voix), notamment sur des Modèles de Mélange de Gaussiennes (MMG). Une méthode d'adaptation des modèles aux caractéristiques des sources mélangées est proposée, et une étude comparative des différents modèles et estimateurs est effectuée. Les résultats montrent que l'adaptation du modèle de musique sur les parties non-vocales des chansons permet d'obtenir de bonnes performances dans un cadre réaliste.

Domaines

Traitement du signal et de l'image [eess.SP] Traitement du signal et de l'image [eess.SP]

Fichier principal

2007_RFTS_ozerov_et_al.pdf (1.81 Mo)

Origine : Fichiers produits par l'(les) auteur(s)

Rémi Gribonval : Connectez-vous pour contacter le contributeur

https://inria.hal.science/inria-00544771

Soumis le : mardi 8 février 2011-22:43:15

Dernière modification le : mardi 26 mars 2024-11:47:13

Archivage à long terme le : lundi 9 mai 2011-02:48:15

Dates et versions

inria-00544771 , version 1 (08-02-2011)

Identifiants

HAL Id : inria-00544771 , version 1

Citer

Alexey Ozerov, Pierrick Philippe, Rémi Gribonval, Frédéric Bimbot. Choix et adaptation de modèles statistiques pour la séparation de voix chantée à partir d'un seul microphone. Traitement du Signal, 2007, 24 (3), pp.211--224. ⟨inria-00544771⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

EC-PARIS UNIV-RENNES1 CNRS INRIA INSA-RENNES IRISA IRISA-D5 INRIA2 UR1-MATH-STIC UR1-UFR-ISTIC UNIV-RENNES INSA-GROUPE UR1-MATH-NUM

162 Consultations

71 Téléchargements

Choix et adaptation de modèles statistiques pour la séparation de voix chantée à partir d'un seul microphone

Résumé

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager