Skip to Main content Skip to Navigation
Conference papers

Forêts aléatoires : remarques méthodologiques

Résumé : On s'intéresse à la méthode des forêts aléatoires d'un point de vue méthodologique. Introduite par Leo Breiman en 2001, elle est désormais largement utilisée tant en classication qu'en régression avec un succès spectaculaire. On vise tout d'abord à confirmer les résultats expérimentaux, connus mais épars, quant au choix des paramètres de la méthode, tant pour les problèmes dits "standards" que pour ceux dits de "grande dimension" (pour lesquels le nombre de variables est très grand vis à vis du nombre d'observations). Mais la contribution principale de cet article est d'étudier le comportement du score d'importance des variables basé sur les forêts aléatoires et d'examiner deux problèmes classiques de sélection de variables. Le premier est de dégager les variables importantes à des fins d'interprétation tandis que le second, plus restrictif, vise à se restreindre à un sous-ensemble suffisant pour la prédiction. La stratégie générale procède en deux étapes : le classement des variables basé sur les scores d'importance suivi d'une procédure d'introduction ascendante séquentielle des variables.
Document type :
Conference papers
Complete list of metadata

Cited literature [29 references]  Display  Hide  Download

https://hal.inria.fr/inria-00386665
Contributor : Conférence Jds2009 <>
Submitted on : Friday, May 22, 2009 - 9:11:36 AM
Last modification on : Tuesday, December 15, 2020 - 10:06:08 AM
Long-term archiving on: : Monday, October 15, 2012 - 10:54:34 AM

File

p105.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : inria-00386665, version 1

Citation

Robin Genuer, Jean-Michel Poggi, Christine Tuleau. Forêts aléatoires : remarques méthodologiques. 41èmes Journées de Statistique, SFdS, Bordeaux, 2009, Bordeaux, France, France. ⟨inria-00386665⟩

Share

Metrics

Record views

469

Files downloads

300