Sélection de modèle incluant des composantes principales

Résumé : Nous considérons un modèle de régression linéaire de grande dimension et plus précisément le cas d'un modèle factoriel pour lequel le vecteur des variables explicatives se décompose en la somme de deux termes aléatoires décrivant respectivement la variabilité spécifique et commune des prédicteurs. Nous montrons tout d'abord que les procédures de sélection de variables et d'estimation usuelles telles que le lasso ou le sélecteur Dantzig sont performantes dans ce contexte et sous l'hypothèse additionnelle que le vecteur des paramètres est sparse. Cette hypothèse peut être cependant restrictive. Nous introduisons ainsi un modèle de régression augmenté qui inclut les composantes principales. Nous montrons que ces composantes peuvent être convenablement estimées à partir de l'échantillon et nous nous concentrons ensuite sur les propriétés théoriques du modèle augmenté.
Type de document :
Communication dans un congrès
42èmes Journées de Statistique, 2010, Marseille, France, France. 2010
Liste complète des métadonnées

Littérature citée [9 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/inria-00494841
Contributeur : Conférence Sfds-Hal <>
Soumis le : jeudi 24 juin 2010 - 08:59:36
Dernière modification le : mardi 11 septembre 2018 - 15:18:14
Document(s) archivé(s) le : lundi 27 septembre 2010 - 11:45:20

Fichier

p205.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : inria-00494841, version 1

Citation

Alois Kneip, Pascal Sarda. Sélection de modèle incluant des composantes principales. 42èmes Journées de Statistique, 2010, Marseille, France, France. 2010. 〈inria-00494841〉

Partager

Métriques

Consultations de la notice

163

Téléchargements de fichiers

40