Skip to Main content Skip to Navigation
Conference papers

Sélection de variables pour la classification non supervisée par mélanges gaussiens et pour l'analyse discriminante gaussienne

Résumé : Les procédures actuelles de sélection de variables dans le cadre de la classification non supervisée supposent souvent que toutes les variables sont indépendantes ou sont toutes liées aux variables significatives pour la classification des données. Nous proposons une modélisation plus générale basée sur une répartition des variables en trois rôles : les variables significatives pour la classification et les variables non significatives; ces dernières étant réparties en deux catégories, celles dépendantes d'une partie, voire de la totalité, des variables significatives pour la classification et celles totalement indépendantes. Cette modélisation du rôle des variables est exploitée dans le cadre de la classification non supervisée par mélanges gaussiens et dans le cadre de l'analyse discriminante gaussienne. Dans les deux contextes, le problème associé à celui de la sélection de variables est ramené à un problème de sélection de modèles. Un critère de type BIC est proposé pour la sélection. L'identifiabilité des modèles et la consistance du critère sont établies. L'intérêt de notre méthode de sélection de variables dans les deux contextes étudiés est mis en évidence par son application sur données simulées.
Document type :
Conference papers
Complete list of metadata

https://hal.inria.fr/inria-00386582
Contributor : Conférence Jds2009 <>
Submitted on : Friday, May 22, 2009 - 9:03:33 AM
Last modification on : Thursday, June 17, 2021 - 3:48:51 AM

Identifiers

  • HAL Id : inria-00386582, version 1
  • PRODINRA : 249702

Citation

Cathy Maugis, Gilles Celeux, Marie-Laure Martin-Magniette. Sélection de variables pour la classification non supervisée par mélanges gaussiens et pour l'analyse discriminante gaussienne. 41èmes Journées de Statistique, SFdS, Bordeaux, 2009, Bordeaux, France, France. ⟨inria-00386582⟩

Share

Metrics

Record views

470