Penalized regression with a combination of the L1 norm and the correlation based penalty. - Inria - Institut national de recherche en sciences et technologies du numérique Accéder directement au contenu
Communication Dans Un Congrès Année : 2009

Penalized regression with a combination of the L1 norm and the correlation based penalty.

Résumé

La sélection de variables peut etre difficile, en particulier dans les situations où un grand nombre de variables explicatives est disponible, avec la présence possible de corrélations élevées comme dans le cas des données d'expression génétique. Dans cette note, nous proposons une nouvelle méthode de régression linéaire pénalisée, appelée elastic corr-net, pour simultanément estimer les paramètres inconnus et sélectionner les variables importantes. De plus, elle encourage un effet de groupe:les variables fortement corrélées ont tendance à etre toutes incluses ou toutes exclues du modèle. La méthode est fondée sur les moindres carrés pénalisés avec une pénalité qui, comme la pénalité $L_1$, rétrécit certains coefficients exactement vers zéro. En outre, cette pénalité contient un terme qui lie explicitement la force de pénalisation à la corrélation entre les variables explicatives. Pour montrer les avantages de notre approche par rapport aux méthodes les plus concurrentes, une étude sur des données simulées est réalisée en moyenne et grande dimension. Enfin, nous appliquons la méthodologie à un exemple de données réelles. Si $p>> n,$ notre méthode reste compétitive et elle permet aussi de sélectionner plus que $n$ variables.
Fichier principal
Vignette du fichier
p67.pdf (124.02 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

inria-00386621 , version 1 (22-05-2009)

Identifiants

  • HAL Id : inria-00386621 , version 1

Citer

Mohammed El Anbari, Abdallah Mkhadri. Penalized regression with a combination of the L1 norm and the correlation based penalty.. 41èmes Journées de Statistique, SFdS, Bordeaux, 2009, Bordeaux, France, France. ⟨inria-00386621⟩
99 Consultations
299 Téléchargements

Partager

Gmail Facebook X LinkedIn More