Sélection de variables pour la classification non supervisée par mélanges gaussiens et pour l'analyse discriminante gaussienne

Cathy Maugis 1 Gilles Celeux 2 Marie-Laure Martin-Magniette 3, 4
2 SELECT - Model selection in statistical learning
Inria Saclay - Ile de France, LMO - Laboratoire de Mathématiques d'Orsay, CNRS - Centre National de la Recherche Scientifique : UMR
Résumé : Les procédures actuelles de sélection de variables dans le cadre de la classification non supervisée supposent souvent que toutes les variables sont indépendantes ou sont toutes liées aux variables significatives pour la classification des données. Nous proposons une modélisation plus générale basée sur une répartition des variables en trois rôles : les variables significatives pour la classification et les variables non significatives; ces dernières étant réparties en deux catégories, celles dépendantes d'une partie, voire de la totalité, des variables significatives pour la classification et celles totalement indépendantes. Cette modélisation du rôle des variables est exploitée dans le cadre de la classification non supervisée par mélanges gaussiens et dans le cadre de l'analyse discriminante gaussienne. Dans les deux contextes, le problème associé à celui de la sélection de variables est ramené à un problème de sélection de modèles. Un critère de type BIC est proposé pour la sélection. L'identifiabilité des modèles et la consistance du critère sont établies. L'intérêt de notre méthode de sélection de variables dans les deux contextes étudiés est mis en évidence par son application sur données simulées.
Type de document :
Communication dans un congrès
41èmes Journées de Statistique, SFdS, Bordeaux, 2009, Bordeaux, France, France. 2009
Liste complète des métadonnées

https://hal.inria.fr/inria-00386582
Contributeur : Conférence Jds2009 <>
Soumis le : vendredi 22 mai 2009 - 09:03:33
Dernière modification le : jeudi 11 janvier 2018 - 06:22:14

Identifiants

  • HAL Id : inria-00386582, version 1

Collections

Citation

Cathy Maugis, Gilles Celeux, Marie-Laure Martin-Magniette. Sélection de variables pour la classification non supervisée par mélanges gaussiens et pour l'analyse discriminante gaussienne. 41èmes Journées de Statistique, SFdS, Bordeaux, 2009, Bordeaux, France, France. 2009. 〈inria-00386582〉

Partager

Métriques

Consultations de la notice

409