130 articles – 87 Notices  [english version]

hal-00492406, version 4

Simultaneous model-based clustering and visualization in the Fisher discriminative subspace

Charles Bouveyron () 1, Camille Brunet 2

Statistics and Computing 22, 1 (2012) 301--324

  • 1 :  Statistique, Analyse et Modélisation Multidisciplinaire (SAmos-Marin Mersenne) (SAMM)
  • http://samm.univ-paris1.fr/
    Université Paris I - Panthéon-Sorbonne Centre Pierre Mendès France 90 Rue de Tolbiac - 75634 Paris Cedex 13 France
  • 2 :  Informatique, Biologie Intégrative et Systèmes Complexes (IBISC)
  • http://www.ibisc.univ-evry.fr/
    Université d'Evry-Val d'Essonne : EA4526 40 rue du Pelvoux, Courcouronnes ; 91020 Evry Cedex France
  • Versions disponibles :  v1 (15-06-2010) v2 (28-09-2010) v3 (12-01-2011) v4 (19-04-2011)
  • Références bibliographiques

    • Type de publication : Articles dans des revues avec comité de lecture
    • Domaine :
      Mathématiques/Statistiques
      Statistiques/Théorie
    • Titre : Simultaneous model-based clustering and visualization in the Fisher discriminative subspace
    • Résumé : Clustering in high-dimensional spaces is nowadays a recurrent problem in many scientific domains but remains a difficult task from both the clustering accuracy and the result understanding points of view. This paper presents a discriminative latent mixture (DLM) model which fits the data in a latent orthonormal discriminative subspace with an intrinsic dimension lower than the dimension of the original space. By constraining model parameters within and between groups, a family of 12 parsimonious DLM models is exhibited which allows to fit onto various situations. An estimation algorithm, called the Fisher-EM algorithm, is also proposed for estimating both the mixture parameters and the discriminative subspace. Experiments on simulated and real datasets show that the proposed approach performs better than existing clustering methods while providing a useful representation of the clustered data. The method is as well applied to the clustering of mass spectrometry data.
    • Langue du texte
      intégral :
      Anglais
    • DOI : 10.1007/s11222-011-9249-9
    • Journal :
      Statistics and Computing
      Publisher Springer Verlag (Germany)
      ISSN 0960-3174 (eISSN : 1573-1375)
    • Audience : internationale
    • Date de publication : 2012
    • Volume : 22
    • Numéro : 1
    • Page, identifiant, ... : 301--324
    • Mots Clés : High-dimensional clustering – Model-based clustering – Discriminative subspace – Fisher criterion – Visualization – Parsimonious models

    Liste des fichiers attachés à ce document :

    PDF
    revision_FisherEM_3.pdf(691.7 KB)
     
    • hal-00492406, version 4
    • oai:hal-paris1.archives-ouvertes.fr:hal-00492406
    • Contributeur : 
    • Soumis le : Mardi 19 Avril 2011, 10:16:21
    • Dernière modification le : Mardi 10 Janvier 2012, 11:55:58