inria-00470775, version 2
On choosing a mixture model for clustering
Joseph Ngatchou-Wandji
1, 2Jan Bulla
3
(2011-09-03)
Résumé : Two methods for both clustering data and choosing a mixture model are proposed. First, the unknown clusters are assessed. Then, the likelihood conditional to these clusters is written as the product of likelihoods from each cluster. AIC and BIC type-approximations are then applied, and the resulting criteria turn out to be the sum of the AIC or BIC relative to each cluster. The performances of our methods are evaluated on real data examples and numerical simulations.
- 1 : Nutrition-Génétique et exposition aux risques environnementaux
- INSERM : U954 – Université Henri Poincaré - Nancy I
- 2 : Département des sciences de l'information et biostatistiques
- École des Hautes Études en Santé Publique [EHESP]
- 3 : Laboratoire de Mathématiques Nicolas Oresme (LMNO)
- CNRS : UMR6139 – Université de Caen Basse-Normandie
- Domaine : Mathématiques/Statistiques
Statistiques/Théorie - Mots-clés : Mixtures models – clustering – AIC – BIC – ICL
- Versions disponibles : v1 (09-04-2010) v2 (05-09-2011)
- inria-00470775, version 2
- http://hal.inria.fr/inria-00470775
- oai:hal.inria.fr:inria-00470775
- Contributeur : Jan Bulla
- Soumis le : Samedi 3 Septembre 2011, 15:02:09
- Dernière modification le : Lundi 5 Septembre 2011, 08:59:14






Documents associés
Exporter