Slope heuristics for variable selection and clustering via Gaussian mixtures

Cathy Maugis 1 Bertrand Michel 1
1 SELECT - Model selection in statistical learning
Inria Saclay - Ile de France, LMO - Laboratoire de Mathématiques d'Orsay, CNRS - Centre National de la Recherche Scientifique : UMR
Abstract : Specific Gaussian mixtures are considered to solve simultaneously variable selection and clustering problems. A penalized likelihood criterion is proposed in Maugis and Michel (2008) to choose the number of mixture components and the relevant variable subset. This criterion is depending on unknown constants to be approximated in practical situations. A "slope heuristics" method is proposed and experimented to deal with this practical problem in this context. Numerical experiments on simulated datasets, a curve clustering example and a genomics application highlight the interest of the proposed heuristics.
Type de document :
Rapport
[Research Report] RR-6550, INRIA. 2008
Liste complète des métadonnées

Littérature citée [39 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/inria-00284620
Contributeur : Cathy Maugis <>
Soumis le : mercredi 4 juin 2008 - 12:59:10
Dernière modification le : jeudi 11 janvier 2018 - 06:22:14
Document(s) archivé(s) le : mardi 21 septembre 2010 - 16:36:34

Fichier

RR-6550.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : inria-00284620, version 2

Collections

Citation

Cathy Maugis, Bertrand Michel. Slope heuristics for variable selection and clustering via Gaussian mixtures. [Research Report] RR-6550, INRIA. 2008. 〈inria-00284620v2〉

Partager

Métriques

Consultations de la notice

207

Téléchargements de fichiers

239