Upper Confidence Trees and Billiards for Optimal Active Learning - Inria - Institut national de recherche en sciences et technologies du numérique Accéder directement au contenu
Communication Dans Un Congrès Année : 2009

Upper Confidence Trees and Billiards for Optimal Active Learning

Résumé

This paper focuses on Active Learning (AL) with bounded compu- tational resources. AL is formalized as a finite horizon Reinforcement Learning problem, and tackled as a single-player game. An approximate optimal AL strat- egy based on tree-structured multi-armed bandit algorithms and billiard-based sampling is presented together with a proof of principle of the approach.
Fichier principal
Vignette du fichier
capfinal.pdf (175.39 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

inria-00369787 , version 1 (21-03-2009)

Identifiants

  • HAL Id : inria-00369787 , version 1

Citer

Philippe Rolet, Michèle Sebag, Olivier Teytaud. Upper Confidence Trees and Billiards for Optimal Active Learning. CAP09, 2009, Hammamet, Tunisie, Tunisia. ⟨inria-00369787⟩
202 Consultations
451 Téléchargements

Partager

Gmail Facebook X LinkedIn More