Mixture of Gaussians for Distance Estimation with Missing Data

E. Eirola 1 Amaury Lendasse 2 Vincent Vandewalle 3, 4 Christophe Biernacki 3, 5
3 MODAL - MOdel for Data Analysis and Learning
Inria Lille - Nord Europe, LPP - Laboratoire Paul Painlevé - UMR 8524, CERIM - Santé publique : épidémiologie et qualité des soins-EA 2694, Polytech Lille, Université de Lille 1, IUT’A
Abstract : The majority of all commonly used machine learning methods can not be applied directly to data sets with missing values. However, most such meth- ods only depend on the relative di erences between samples instead of their particular values, and thus one useful approach is to directly estimate the pairwise distances between all samples in the data set. This is accomplished by tting a Gaussian mixture model to the data, and using it to derive estimates for the distances. Experimental simulations con rm that the pro- posed method provides accurate estimates compared to alternative methods for estimating distances.
Type de document :
Article dans une revue
Neurocomputing, Elsevier, 2014, 131, pp.32-42
Liste complète des métadonnées

Littérature citée [29 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/hal-00921023
Contributeur : Christophe Biernacki <>
Soumis le : mardi 30 décembre 2014 - 14:54:47
Dernière modification le : jeudi 11 janvier 2018 - 06:23:17
Document(s) archivé(s) le : mardi 31 mars 2015 - 10:22:02

Fichier

Publication206.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-00921023, version 2

Collections

Citation

E. Eirola, Amaury Lendasse, Vincent Vandewalle, Christophe Biernacki. Mixture of Gaussians for Distance Estimation with Missing Data. Neurocomputing, Elsevier, 2014, 131, pp.32-42. 〈hal-00921023v2〉

Partager

Métriques

Consultations de la notice

254

Téléchargements de fichiers

346