Sélection de modèle incluant des composantes principales - Inria - Institut national de recherche en sciences et technologies du numérique Accéder directement au contenu
Communication Dans Un Congrès Année : 2010

Sélection de modèle incluant des composantes principales

Résumé

Nous considérons un modèle de régression linéaire de grande dimension et plus précisément le cas d'un modèle factoriel pour lequel le vecteur des variables explicatives se décompose en la somme de deux termes aléatoires décrivant respectivement la variabilité spécifique et commune des prédicteurs. Nous montrons tout d'abord que les procédures de sélection de variables et d'estimation usuelles telles que le lasso ou le sélecteur Dantzig sont performantes dans ce contexte et sous l'hypothèse additionnelle que le vecteur des paramètres est sparse. Cette hypothèse peut être cependant restrictive. Nous introduisons ainsi un modèle de régression augmenté qui inclut les composantes principales. Nous montrons que ces composantes peuvent être convenablement estimées à partir de l'échantillon et nous nous concentrons ensuite sur les propriétés théoriques du modèle augmenté.
Fichier principal
Vignette du fichier
p205.pdf (94 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

inria-00494841 , version 1 (24-06-2010)

Identifiants

  • HAL Id : inria-00494841 , version 1

Citer

Alois Kneip, Pascal Sarda. Sélection de modèle incluant des composantes principales. 42èmes Journées de Statistique, 2010, Marseille, France, France. ⟨inria-00494841⟩
95 Consultations
30 Téléchargements

Partager

Gmail Facebook X LinkedIn More