Model-Based Co-clustering for Ordinal Data

Julien Jacques 1, 2 Christophe Biernacki 3, 2
2 MODAL - MOdel for Data Analysis and Learning
Inria Lille - Nord Europe, LPP - Laboratoire Paul Painlevé - UMR 8524, CERIM - Santé publique : épidémiologie et qualité des soins-EA 2694, Polytech Lille - École polytechnique universitaire de Lille, Université de Lille, Sciences et Technologies
Abstract : A model-based co-clustering algorithm for ordinal data is presented. This algorithm relies on the latent block model embedding a probability distribution specific to ordinal data (the so-called BOS or Binary Ordinal Search distribution). Model inference relies on a Stochastic EM algorithm coupled with a Gibbs sampler, and the ICL-BIC criterion is used for selecting the number of co-clusters (or blocks). The main advantage of this ordinal dedicated co-clustering model is its parsimony, the interpretability of the co-cluster parameters (mode, precision) and the possibility to take into account missing data. Numerical experiments on simulated data show the efficiency of the inference strategy, and real data analyses illustrate the interest of the proposed procedure.
Type de document :
Article dans une revue
Computational Statististics & Data Analysis, 2018, 123, pp.15
Liste complète des métadonnées

Littérature citée [32 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/hal-01448299
Contributeur : Julien Jacques <>
Soumis le : jeudi 28 septembre 2017 - 00:46:06
Dernière modification le : mardi 11 décembre 2018 - 01:15:51
Document(s) archivé(s) le : vendredi 29 décembre 2017 - 12:26:38

Fichier

ordinal-coclustering-Jacques-B...
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-01448299, version 2

Collections

Citation

Julien Jacques, Christophe Biernacki. Model-Based Co-clustering for Ordinal Data. Computational Statististics & Data Analysis, 2018, 123, pp.15. 〈hal-01448299v2〉

Partager

Métriques

Consultations de la notice

316

Téléchargements de fichiers

435