Upper Confidence Trees and Billiards for Optimal Active Learning

Philippe Rolet 1, 2 Michèle Sebag 1, 2 Olivier Teytaud 1, 2
2 TAO - Machine Learning and Optimisation
CNRS - Centre National de la Recherche Scientifique : UMR8623, Inria Saclay - Ile de France, UP11 - Université Paris-Sud - Paris 11, LRI - Laboratoire de Recherche en Informatique
Abstract : This paper focuses on Active Learning (AL) with bounded compu- tational resources. AL is formalized as a finite horizon Reinforcement Learning problem, and tackled as a single-player game. An approximate optimal AL strat- egy based on tree-structured multi-armed bandit algorithms and billiard-based sampling is presented together with a proof of principle of the approach.
Type de document :
Communication dans un congrès
CAP09, 2009, Hammamet, Tunisie, Tunisia. 2009
Liste complète des métadonnées

Littérature citée [19 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/inria-00369787
Contributeur : Olivier Teytaud <>
Soumis le : samedi 21 mars 2009 - 09:58:28
Dernière modification le : jeudi 11 janvier 2018 - 06:22:14
Document(s) archivé(s) le : vendredi 12 octobre 2012 - 14:05:35

Fichier

capfinal.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : inria-00369787, version 1

Citation

Philippe Rolet, Michèle Sebag, Olivier Teytaud. Upper Confidence Trees and Billiards for Optimal Active Learning. CAP09, 2009, Hammamet, Tunisie, Tunisia. 2009. 〈inria-00369787〉

Partager

Métriques

Consultations de la notice

277

Téléchargements de fichiers

151