220 articles  [version française]

inria-00386697, version 1

LASSO transductif et autres généralisations

Pierre Alquier 12, Mohamed Hebiri 1

41èmes Journées de Statistique, SFdS, Bordeaux (2009)

Abstract: On considère le problème de régression linéaire dans lequel le nombre de variables explicatives p peut être plus grand que le nombre d'observation n. Sous des hypothèses de parcimonie, nous proposons dans cette étude une généralisation de l'estimateur LASSO de Tibshirani (1996), qui s'appuie sur des considérations géométriques présentées par Alquier and Hebiri (2008) et prenant en compte l'objectif du statisticien. Le problème de l'estimation du paramètre inconnu dans le cadre transductif (Vapnik, 1998) est également considéré, i.e., une approche dans laquelle la construction de l'estimateur s'appuie sur un nouvel échantillon non étiqueté et pour lequel nous souhaitons réaliser de bonne performances de prédiction. Du point de vue théorique, nous illustrons nos résultats par des "Inégalités de Sparsité", i.e., des bornes sur l'erreur d'estimation qui font intervenir la parcimonie du paramètre que l'on veut estimer. Nous proposons également un algorithme d'optimisation coordonnée par coordonnée pour approximer notre estimateur.

  • 1:  Laboratoire de Probabilités et Modèles Aléatoires (LPMA)
  • CNRS : UMR7599 – Université Pierre et Marie Curie [UPMC] - Paris VI – Université Paris VII - Paris Diderot
  • 2:  Centre de Recherche en Économie et Statistique (CREST)
  • INSEE – École Nationale de la Statistique et de l'Administration Économique
  • Domain : Mathematics/Statistics
 
  • inria-00386697, version 1
  • oai:hal.inria.fr:inria-00386697
  • From: 
  • Submitted for: 
  • Submitted on: Friday, 22 May 2009 09:13:38
  • Updated on: Monday, 25 May 2009 07:02:26