Gaussian Parsimonious Clustering Models Scale Invariant and Stable by Projection - Inria - Institut national de recherche en sciences et technologies du numérique Accéder directement au contenu
Article Dans Une Revue Statistics and Computing Année : 2013

Gaussian Parsimonious Clustering Models Scale Invariant and Stable by Projection

Résumé

Gaussian mixture model-based clustering is now a standard tool to determine an hypothetical underlying structure into continuous data. However many usual parsimonious models, despite their appealing geometrical interpretation, suffer from major drawbacks as scale dependence or unsustainability of the constraints by projection. In this work we present a new family of parsimonious Gaussian models based on a variance-correlation decomposition of the covariance matrices. These new models are stable by projection into the canonical planes and, so, faithfully representable in low dimension. They are also stable by modification of the measurement units of the data and such a modification does not change the model selection based on likelihood criteria. We highlight all these stability properties by a specific geometrical representation of each model. A detailed GEM algorithm is also provided for every model inference. Then, on biological and geological data, we compare our stable models to standard geometrical ones.
La classification à base de modèles de mélanges gaussiens est maintenant un outil standard pour déterminer une hypothétique structure cachée dans un jeu de données continues. Pourtant de nombreux modèles parcimonieux usuels, malgré leur interprétation géométrique conviviale, souffrent de défauts majeurs comme la dépendance aux unités de mesure ou encore la violation des contraintes par projection. Dans ce travail, nous présentons une nouvelle famille de modèles gaussiens parcimonieux reposant sur une décomposition variance-corrélation des matrices de covariance. Ces nouveaux modèles sont stables par projection sur les plans canoniques et, par conséquent, fidèlement représentables en faible dimension. Ils sont aussi indépendants des unités de mesure des données, ce qui signifie que ce choix parfois arbitraire n'a aucune conséquence sur la sélection de modèle reposant sur des critères à base de vraisemblance. Nous mettons en évidence toutes ces propriétés de stabilité par une représentation géométrique spécifique à chacun des modèles. Un algorithme GEM est aussi donné en détail pour estimer leurs paramètres. Nous comparons enfin nos modèles stables et les modèles géométriques standards sur des données réelles issues de la biologie et de la géologie.
Fichier principal
Vignette du fichier
RR_7932.pdf (1.01 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-00688250 , version 1 (17-04-2012)

Identifiants

  • HAL Id : hal-00688250 , version 1

Citer

Christophe Biernacki, Alexandre Lourme. Gaussian Parsimonious Clustering Models Scale Invariant and Stable by Projection. Statistics and Computing, 2013, pp.21. ⟨hal-00688250⟩
138 Consultations
186 Téléchargements

Partager

Gmail Facebook X LinkedIn More