Skip to Main content Skip to Navigation
Conference papers

Bornes de risque pour les forêts purement uniformément aléatoires

Robin Genuer 1, 2 
2 SELECT - Model selection in statistical learning
Inria Saclay - Ile de France, LMO - Laboratoire de Mathématiques d'Orsay
Résumé : Introduites par Leo Breiman en 2001, les forêts aléatoires sont une méthode statistique très performante. D'un point de vue théorique, leur analyse est difficile, du fait de la complexité de l'algorithme. Pour expliquer ces performances, des versions de forêts aléatoires simplifiées (et donc plus faciles à analyser) ont été introduites : les forêts purement aléatoires. Dans cet article, nous introduisons une autre version simplifiée, que nous appelons forêts purement uniformément aléatoires. Dans un contexte de régression avec une seule variable explicative, nous montrons que les arbres aléatoires ainsi que les forêts aléatoires atteignent la vitesse de convergence minimax. Et plus important, nous prouvons que les forêts aléatoires améliorent les performances des arbres aléatoires, en réduisant la variance des estimateurs associés d'un facteur trois quarts.
Complete list of metadata

Cited literature [6 references]  Display  Hide  Download

https://hal.inria.fr/inria-00494837
Contributor : Conférence Sfds-Hal Connect in order to contact the contributor
Submitted on : Thursday, June 24, 2010 - 8:59:32 AM
Last modification on : Sunday, June 26, 2022 - 11:51:55 AM
Long-term archiving on: : Monday, October 22, 2012 - 2:48:23 PM

File

p201.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : inria-00494837, version 1

Citation

Robin Genuer. Bornes de risque pour les forêts purement uniformément aléatoires. 42èmes Journées de Statistique, 2010, Marseille, France, France. ⟨inria-00494837⟩

Share

Metrics

Record views

101

Files downloads

65