Forêts aléatoires : remarques méthodologiques

Robin Genuer 1, 2 Jean-Michel Poggi 1, 2 Christine Tuleau 3
2 SELECT - Model selection in statistical learning
Inria Saclay - Ile de France, LMO - Laboratoire de Mathématiques d'Orsay, CNRS - Centre National de la Recherche Scientifique : UMR
Résumé : On s'intéresse à la méthode des forêts aléatoires d'un point de vue méthodologique. Introduite par Leo Breiman en 2001, elle est désormais largement utilisée tant en classication qu'en régression avec un succès spectaculaire. On vise tout d'abord à confirmer les résultats expérimentaux, connus mais épars, quant au choix des paramètres de la méthode, tant pour les problèmes dits "standards" que pour ceux dits de "grande dimension" (pour lesquels le nombre de variables est très grand vis à vis du nombre d'observations). Mais la contribution principale de cet article est d'étudier le comportement du score d'importance des variables basé sur les forêts aléatoires et d'examiner deux problèmes classiques de sélection de variables. Le premier est de dégager les variables importantes à des fins d'interprétation tandis que le second, plus restrictif, vise à se restreindre à un sous-ensemble suffisant pour la prédiction. La stratégie générale procède en deux étapes : le classement des variables basé sur les scores d'importance suivi d'une procédure d'introduction ascendante séquentielle des variables.
Type de document :
Communication dans un congrès
41èmes Journées de Statistique, SFdS, Bordeaux, 2009, Bordeaux, France, France. 2009
Liste complète des métadonnées

Littérature citée [29 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/inria-00386665
Contributeur : Conférence Jds2009 <>
Soumis le : vendredi 22 mai 2009 - 09:11:36
Dernière modification le : vendredi 12 janvier 2018 - 02:00:35
Document(s) archivé(s) le : lundi 15 octobre 2012 - 10:54:34

Fichier

p105.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : inria-00386665, version 1

Citation

Robin Genuer, Jean-Michel Poggi, Christine Tuleau. Forêts aléatoires : remarques méthodologiques. 41èmes Journées de Statistique, SFdS, Bordeaux, 2009, Bordeaux, France, France. 2009. 〈inria-00386665〉

Partager

Métriques

Consultations de la notice

335

Téléchargements de fichiers

218