Risk bounds for purely uniformly random forests

Robin Genuer 1, 2
2 SELECT - Model selection in statistical learning
Inria Saclay - Ile de France, LMO - Laboratoire de Mathématiques d'Orsay, CNRS - Centre National de la Recherche Scientifique : UMR
Résumé : Introduites par Leo Breiman en 2001, les forêts aléatoires sont une méthode statistique très performante. D'un point de vue théorique, leur analyse est difficile, du fait de la complexité de l'algorithme. Pour expliquer ces performances, des versions de forêts aléatoires simplifiées, et donc plus faciles à analyser, ont été introduites. Ces versions ont été appelées forêts purement aléatoires. Dans cet article, nous introduisons une autre version simplifiée, que nous appelons forêts purement uniformément aléatoires. Dans un contexte de régression, avec une seule variable explicative, nous montrons que les arbres aléatoires ainsi que les forêts aléatoires atteignent la vitesse de convergence minimax. De plus, nous prouvons que les forêts aléatoires améliorent les performances des arbres aléatoires, en réduisant la variance des estimateurs associés d'un facteur de trois quarts.
Type de document :
Rapport
[Research Report] RR-7318, INRIA. 2010, pp.19
Liste complète des métadonnées

Littérature citée [10 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/inria-00492231
Contributeur : Robin Genuer <>
Soumis le : mardi 15 juin 2010 - 14:13:20
Dernière modification le : jeudi 11 janvier 2018 - 06:22:14
Document(s) archivé(s) le : mercredi 15 septembre 2010 - 20:32:54

Fichiers

RR-7318.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : inria-00492231, version 1
  • ARXIV : 1006.2980

Collections

Citation

Robin Genuer. Risk bounds for purely uniformly random forests. [Research Report] RR-7318, INRIA. 2010, pp.19. 〈inria-00492231〉

Partager

Métriques

Consultations de la notice

381

Téléchargements de fichiers

160