A predictive deviance criterion for selecting a generative model in semi-supervised classification

Vincent Vandewalle 1, 2 Christophe Biernacki 2 Gilles Celeux 1 Gérard Govaert 3
1 SELECT - Model selection in statistical learning
Inria Saclay - Ile de France, LMO - Laboratoire de Mathématiques d'Orsay, CNRS - Centre National de la Recherche Scientifique : UMR
Résumé : La classification semi-supervisée donne l'opportunité d'améliorer les classifieurs génératifs par la prise en compte de l'information des points non étiquetés lorsque ceux-ci sont beaucoup plus nombreux que les points étiquetés. Cet article a trait à la sélection d'un modèle de classification génératif dans un contexte semi-supervisé. Nous proposons un crit\ère de déviance prédictive AIC$_{cond}$ pour choisir un modèle génératif parcimonieux de classification. Au contraire des critères classiques d'information comme AIC ou BIC, AIC$_{cond}$ se focalise sur le but de classification en mesurant le pouvoir prédictif d'un modèle génératif par sa déviance prédictive. Par ailleurs, il évite les problèmes de temps de calcul inhérents à la validation croisée à cause de l'emploi répété de l'algorithme EM. Nous prouvons des propriétés de convergence du critère AIC$_{cond}$ qui assurent sa supériorité vis-à-vis du critère d'entropie bayésienne BEC dont le but est analogue. De plus, des illustrations numériques sur des données réelles et simulées mettent en lumière un comportement prometteur de AIC$_{cond}$ par rapport aux critères mentionnés pour la sélection de variables et de modèles génératifs de classification à partir d'échantillons semi-supervisés.
Type de document :
Article dans une revue
Computational Statistics and Data Analysis, Elsevier, 2013, 64, pp.220-236
Liste complète des métadonnées

Littérature citée [21 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/inria-00516991
Contributeur : Gilles Celeux <>
Soumis le : lundi 13 septembre 2010 - 12:39:14
Dernière modification le : mercredi 4 juillet 2018 - 16:44:02
Document(s) archivé(s) le : mardi 14 décembre 2010 - 02:44:12

Fichiers

RR-7377.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : inria-00516991, version 1

Collections

Citation

Vincent Vandewalle, Christophe Biernacki, Gilles Celeux, Gérard Govaert. A predictive deviance criterion for selecting a generative model in semi-supervised classification. Computational Statistics and Data Analysis, Elsevier, 2013, 64, pp.220-236. 〈inria-00516991〉

Partager

Métriques

Consultations de la notice

635

Téléchargements de fichiers

357