Bornes de risque pour les forêts purement uniformément aléatoires - Inria - Institut national de recherche en sciences et technologies du numérique Access content directly
Conference Papers Year : 2010

Bornes de risque pour les forêts purement uniformément aléatoires

Abstract

Introduites par Leo Breiman en 2001, les forêts aléatoires sont une méthode statistique très performante. D'un point de vue théorique, leur analyse est difficile, du fait de la complexité de l'algorithme. Pour expliquer ces performances, des versions de forêts aléatoires simplifiées (et donc plus faciles à analyser) ont été introduites : les forêts purement aléatoires. Dans cet article, nous introduisons une autre version simplifiée, que nous appelons forêts purement uniformément aléatoires. Dans un contexte de régression avec une seule variable explicative, nous montrons que les arbres aléatoires ainsi que les forêts aléatoires atteignent la vitesse de convergence minimax. Et plus important, nous prouvons que les forêts aléatoires améliorent les performances des arbres aléatoires, en réduisant la variance des estimateurs associés d'un facteur trois quarts.
Fichier principal
Vignette du fichier
p201.pdf (67.79 Ko) Télécharger le fichier
Origin : Files produced by the author(s)
Loading...

Dates and versions

inria-00494837 , version 1 (24-06-2010)

Identifiers

  • HAL Id : inria-00494837 , version 1

Cite

Robin Genuer. Bornes de risque pour les forêts purement uniformément aléatoires. 42èmes Journées de Statistique, 2010, Marseille, France, France. ⟨inria-00494837⟩
104 View
70 Download

Share

Gmail Facebook X LinkedIn More