inria-00386697, version 1
LASSO transductif et autres généralisations
Pierre Alquier 1, 2Mohamed Hebiri 1
41èmes Journées de Statistique, SFdS, Bordeaux (2009)
Résumé : On considère le problème de régression linéaire dans lequel le nombre de variables explicatives p peut être plus grand que le nombre d'observation n. Sous des hypothèses de parcimonie, nous proposons dans cette étude une généralisation de l'estimateur LASSO de Tibshirani (1996), qui s'appuie sur des considérations géométriques présentées par Alquier and Hebiri (2008) et prenant en compte l'objectif du statisticien. Le problème de l'estimation du paramètre inconnu dans le cadre transductif (Vapnik, 1998) est également considéré, i.e., une approche dans laquelle la construction de l'estimateur s'appuie sur un nouvel échantillon non étiqueté et pour lequel nous souhaitons réaliser de bonne performances de prédiction. Du point de vue théorique, nous illustrons nos résultats par des "Inégalités de Sparsité", i.e., des bornes sur l'erreur d'estimation qui font intervenir la parcimonie du paramètre que l'on veut estimer. Nous proposons également un algorithme d'optimisation coordonnée par coordonnée pour approximer notre estimateur.
- 1 : Laboratoire de Probabilités et Modèles Aléatoires (LPMA)
- CNRS : UMR7599 – Université Paris VI - Pierre et Marie Curie – Université Paris VII - Paris Diderot
- 2 : Centre de Recherche en Économie et Statistique (CREST)
- INSEE – École Nationale de la Statistique et de l'Administration Économique
- Domaine : Mathématiques/Statistiques
- inria-00386697, version 1
- http://hal.inria.fr/inria-00386697
- oai:hal.inria.fr:inria-00386697
- Contributeur : Conférence Jds2009
- Déposé pour le compte de :
- Soumis le : Vendredi 22 Mai 2009, 09:13:38
- Dernière modification le : Lundi 25 Mai 2009, 07:02:26






Documents associés
Exporter