Classification simultanée à base de mélanges gaussiens pour des échantillons d'origines multiples

Résumé : Habituellement, quand on cherche à partitionner des échantillons provenant de populations différentes, on met en oeuvre plusieurs procédures de classification indépendantes. Mais lorsque les échantillons sont décrits par les mêmes variables et que la partition a la même signification d'un échantillon à l'autre, nous proposons d'appliquer une procédure dite de classification simultanée. Il s'agit, dans un contexte de mélanges gaussiens, d'établir, sous des hypothèses simples et réalistes, un lien stochastique linéaire entre les composantes normales des populations, ce qui permet d'estimer simultanément le paramètre de tous les mélanges afin de classer les individus des différents échantillons. En nous inspirant de modèles parcimonieux de mélanges gaussiens, classiques, nous proposons plusieurs modèles de contraintes portant à la fois sur le paramètre des mélanges et sur le lien linéaire entre les populations. Le critère BIC permet de choisir un de ces modèles, mais aussi de comparer les deux méthodes de classification, indépendante et simultanée. Grâce à un exemple biologique, dans lequel des échantillons d'oiseaux provenant de trois espèces différentes doivent être classés selon leur sexe, nous observons que la classification simultanée donne des résultats prometteurs.
Type de document :
Communication dans un congrès
41èmes Journées de Statistique, SFdS, Bordeaux, 2009, Bordeaux, France, France. 2009
Liste complète des métadonnées

Littérature citée [5 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/inria-00386661
Contributeur : Conférence Jds2009 <>
Soumis le : vendredi 22 mai 2009 - 09:11:22
Dernière modification le : jeudi 11 janvier 2018 - 06:12:17
Document(s) archivé(s) le : jeudi 10 juin 2010 - 21:40:34

Fichier

p102.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : inria-00386661, version 1

Collections

Citation

Alexandre Lourme, Christophe Biernacki. Classification simultanée à base de mélanges gaussiens pour des échantillons d'origines multiples. 41èmes Journées de Statistique, SFdS, Bordeaux, 2009, Bordeaux, France, France. 2009. 〈inria-00386661〉

Partager

Métriques

Consultations de la notice

320

Téléchargements de fichiers

93