Skip to Main content Skip to Navigation
Reports

Multichannel audio source separation with deep neural networks

Aditya Arie Nugraha 1 Antoine Liutkus 1 Emmanuel Vincent 1
1 MULTISPEECH - Speech Modeling for Facilitating Oral-Based Communication
Inria Nancy - Grand Est, LORIA - NLPKD - Department of Natural Language Processing & Knowledge Discovery
Résumé : Ce rapport de recherche traite du problème de la séparation de sources audio multicanale. Quelques travaux ont traité le problème de la séparation de sources monocanale par réseaux de neurones profonds (DNNs). Nous présentons une nouvelle approche pour la séparation de sources multicanale où (1) les paramètres spectraux et spatiaux sont mis à jour itérativement de façon similaire à l'algorithme Espérance-Maximisation (EM) et (2) des DNNs sont utilisés pour la mise à jour des paramètres spectraux. Nous évaluons plusieurs systèmes basés sur cette approche en participant à la tâche ``enregistrements musicaux professionnels'' de SiSEC 2015. Les résultats montrent que cette approche fonctionne bien pour la séparation de la voix chantée et des autres instruments dans un mélange contenant plusieurs instruments.
Document type :
Reports
Complete list of metadatas

https://hal.inria.fr/hal-01163369
Contributor : Aditya Arie Nugraha <>
Submitted on : Thursday, July 16, 2015 - 5:56:19 PM
Last modification on : Saturday, November 16, 2019 - 7:04:01 PM
Document(s) archivé(s) le : Wednesday, April 26, 2017 - 6:50:17 AM

File

RR-8740.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : hal-01163369, version 2

Citation

Aditya Arie Nugraha, Antoine Liutkus, Emmanuel Vincent. Multichannel audio source separation with deep neural networks. [Research Report] RR-8740, INRIA. 2015. ⟨hal-01163369v2⟩

Share

Metrics

Record views

215

Files downloads

1615