Penalized regression with a combination of the L1 norm and the correlation based penalty.

Mohammed El Anbari 1, 2 Abdallah Mkhadri 2
1 SELECT - Model selection in statistical learning
Inria Saclay - Ile de France, LMO - Laboratoire de Mathématiques d'Orsay, CNRS - Centre National de la Recherche Scientifique : UMR
Résumé : La sélection de variables peut etre difficile, en particulier dans les situations où un grand nombre de variables explicatives est disponible, avec la présence possible de corrélations élevées comme dans le cas des données d'expression génétique. Dans cette note, nous proposons une nouvelle méthode de régression linéaire pénalisée, appelée elastic corr-net, pour simultanément estimer les paramètres inconnus et sélectionner les variables importantes. De plus, elle encourage un effet de groupe:les variables fortement corrélées ont tendance à etre toutes incluses ou toutes exclues du modèle. La méthode est fondée sur les moindres carrés pénalisés avec une pénalité qui, comme la pénalité $L_1$, rétrécit certains coefficients exactement vers zéro. En outre, cette pénalité contient un terme qui lie explicitement la force de pénalisation à la corrélation entre les variables explicatives. Pour montrer les avantages de notre approche par rapport aux méthodes les plus concurrentes, une étude sur des données simulées est réalisée en moyenne et grande dimension. Enfin, nous appliquons la méthodologie à un exemple de données réelles. Si $p>> n,$ notre méthode reste compétitive et elle permet aussi de sélectionner plus que $n$ variables.
Type de document :
Communication dans un congrès
41èmes Journées de Statistique, SFdS, Bordeaux, 2009, Bordeaux, France, France. 2009
Liste complète des métadonnées

Littérature citée [5 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/inria-00386621
Contributeur : Conférence Jds2009 <>
Soumis le : vendredi 22 mai 2009 - 09:07:31
Dernière modification le : jeudi 11 janvier 2018 - 06:22:14
Document(s) archivé(s) le : jeudi 30 juin 2011 - 11:32:35

Fichier

p67.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : inria-00386621, version 1

Collections

Citation

Mohammed El Anbari, Abdallah Mkhadri. Penalized regression with a combination of the L1 norm and the correlation based penalty.. 41èmes Journées de Statistique, SFdS, Bordeaux, 2009, Bordeaux, France, France. 2009. 〈inria-00386621〉

Partager

Métriques

Consultations de la notice

200

Téléchargements de fichiers

348