Enhancing the selection of a model-based clustering with external qualitative variables

Jean-Patrick Baudry 1 Margarida Cardoso 2 Gilles Celeux 3 Maria-José Amorim 4 Ana Sousa Ferreira 5
2 BRU-UNIDE
IST - Instituto Superior Técnico [Lisboa]
3 SELECT - Model selection in statistical learning
Inria Saclay - Ile de France, LMO - Laboratoire de Mathématiques d'Orsay, CNRS - Centre National de la Recherche Scientifique : UMR
4 ISEL
IST - Instituto Superior Técnico [Lisboa]
5 BRU-UNIDE & CEAUL
IST - Instituto Superior Técnico [Lisboa]
Résumé : En classification non supervisée, il est souvent utile d'interpréter la classification à l'aide de variables qualitatives externes qui définissent elles-mêmes des partitions. Nous proposons une approche fondée sur le modèle de mélange de lois de probabilité permettant de sélectionner un modèle et le nombre de classes produisant à la fois un bon ajustement des données et possédant une liaison forte avec les variables qualitatives externes. Cette approche se fonde sur un critère approximant la vraisemblance intégrée des données complétées par les étiquettes de la partition cherchée et par celles des partitions associées aux variables externes. Il est important de souligner que les variables externes sont seulement utilisées pour sélectionner un modèle de mélange estimé par la méthode du maximum de vraisemblance. Des illustrations numériques montrent le comportement prometteur du critère proposé.
Type de document :
Rapport
[Research Report] RR-8124, INRIA. 2012, pp.14


https://hal.inria.fr/hal-00747387
Contributeur : Gilles Celeux <>
Soumis le : mercredi 31 octobre 2012 - 11:17:40
Dernière modification le : samedi 17 septembre 2016 - 01:36:51
Document(s) archivé(s) le : vendredi 1 février 2013 - 03:37:53

Fichier

RR-8124.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-00747387, version 1

Collections

Citation

Jean-Patrick Baudry, Margarida Cardoso, Gilles Celeux, Maria-José Amorim, Ana Sousa Ferreira. Enhancing the selection of a model-based clustering with external qualitative variables. [Research Report] RR-8124, INRIA. 2012, pp.14. <hal-00747387>

Exporter

Partager

Métriques

Consultations de
la notice

604

Téléchargements du document

1957