Gaussian Parsimonious Clustering Models Scale Invariant and Stable by Projection

Christophe Biernacki 1, 2 Alexandre Lourme 1, 2
1 MODAL - MOdel for Data Analysis and Learning
Inria Lille - Nord Europe, LPP - Laboratoire Paul Painlevé - UMR 8524, CERIM - Santé publique : épidémiologie et qualité des soins-EA 2694, Polytech Lille, Université de Lille 1, IUT’A
Résumé : La classification à base de modèles de mélanges gaussiens est maintenant un outil standard pour déterminer une hypothétique structure cachée dans un jeu de données continues. Pourtant de nombreux modèles parcimonieux usuels, malgré leur interprétation géométrique conviviale, souffrent de défauts majeurs comme la dépendance aux unités de mesure ou encore la violation des contraintes par projection. Dans ce travail, nous présentons une nouvelle famille de modèles gaussiens parcimonieux reposant sur une décomposition variance-corrélation des matrices de covariance. Ces nouveaux modèles sont stables par projection sur les plans canoniques et, par conséquent, fidèlement représentables en faible dimension. Ils sont aussi indépendants des unités de mesure des données, ce qui signifie que ce choix parfois arbitraire n'a aucune conséquence sur la sélection de modèle reposant sur des critères à base de vraisemblance. Nous mettons en évidence toutes ces propriétés de stabilité par une représentation géométrique spécifique à chacun des modèles. Un algorithme GEM est aussi donné en détail pour estimer leurs paramètres. Nous comparons enfin nos modèles stables et les modèles géométriques standards sur des données réelles issues de la biologie et de la géologie.
Type de document :
Article dans une revue
Statistics and Computing, Springer Verlag (Germany), 2013, In press
Liste complète des métadonnées

https://hal.inria.fr/hal-00688250
Contributeur : Christophe Biernacki <>
Soumis le : mardi 17 avril 2012 - 10:52:07
Dernière modification le : mardi 3 juillet 2018 - 11:33:38
Document(s) archivé(s) le : mercredi 18 juillet 2012 - 02:25:50

Fichier

RR_7932.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-00688250, version 1

Collections

Citation

Christophe Biernacki, Alexandre Lourme. Gaussian Parsimonious Clustering Models Scale Invariant and Stable by Projection. Statistics and Computing, Springer Verlag (Germany), 2013, In press. 〈hal-00688250〉

Partager

Métriques

Consultations de la notice

342

Téléchargements de fichiers

235