Choix de modèles quand la vraisemblance est incalculable

Christine Keribin 1, 2, *
* Auteur correspondant
2 SELECT - Model selection in statistical learning
Inria Saclay - Ile de France, LMO - Laboratoire de Mathématiques d'Orsay, CNRS - Centre National de la Recherche Scientifique : UMR
Résumé : Les critères pénalisés comme le critère BIC sont des méthodes fréquemment utilisées pour la sélection de modèles et qui nécessitent le calcul de la vraisemblance. Malheureusement, il peut arriver que la vraisemblance ne soit pas numériquement calculable, comme c'est le cas par exemple pour le modèle des blocs latents (LBM). LBM est un modèle de mélange pour la classification croisée (co-clustering), permettant la classification non supervisée simultanée des lignes et colonnes de grandes matrices de données. A cause de la structure de dépendance complexe entre les variables d'appartenance à une classe en ligne et en colonne conditionnellement aux observations, il est nécessaire d' opérer des approximations pour calculer l'étape d'estimation de l'algorithme EM, conduisant ainsi à un minorant de la vraisemblance maximisée. Pour la même raison, l'approximation asymptotique usuelle pour définir le critère BIC doit être remise en question. D'un autre côté, le critère de vraisemblance complète intégrée (ICL) peut être calculé de façon ex-acte pour LBM, mais nécessite d'étudier l'influence d'hyper-paramètres. Les liens entre les deux critères sont analysés et une comparaison avec l' inférence bayésienne est discutée.
Type de document :
Communication dans un congrès
47èmes Journées de Statistique de la SFdS, Jun 2015, Lille, France
Liste complète des métadonnées

https://hal.inria.fr/hal-01260761
Contributeur : Christine Keribin <>
Soumis le : vendredi 22 janvier 2016 - 15:37:14
Dernière modification le : jeudi 11 janvier 2018 - 06:22:14

Identifiants

  • HAL Id : hal-01260761, version 1

Collections

Citation

Christine Keribin. Choix de modèles quand la vraisemblance est incalculable. 47èmes Journées de Statistique de la SFdS, Jun 2015, Lille, France. 〈hal-01260761〉

Partager

Métriques

Consultations de la notice

312

Téléchargements de fichiers

43