Error Reducing Sampling in Reinforcement Learning

Bruno Scherrer 1 Shie Mannor 2
1 MAIA - Autonomous intelligent machine
INRIA Lorraine, LORIA - Laboratoire Lorrain de Recherche en Informatique et ses Applications
Abstract : In reinforcement learning, an agent collects information interacting with an environment and uses it to derive a behavior. This paper focuses on efficient sampling; that is, the problem of choosing the interaction samples so that the corresponding behavior tends quickly to the optimal behavior. Our main result is a sensitivity analysis relating the choice of sampling any state-action pair to the decrease of an error bound on the optimal solution. We derive two new model-based algorithms. Simulations demonstrate a quicker convergence (in the sense of the number of samples) of the value function to the real optimal value function.
Type de document :
Communication dans un congrès
NIPS-08 Workshop on Model Uncertainty and Risk in Reinforcement Learning, Dec 2008, Whistler, Canada. 2008
Liste complète des métadonnées

Littérature citée [14 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/inria-00337659
Contributeur : Bruno Scherrer <>
Soumis le : vendredi 7 novembre 2008 - 15:47:01
Dernière modification le : jeudi 11 janvier 2018 - 06:19:50
Document(s) archivé(s) le : lundi 7 juin 2010 - 22:49:09

Fichier

scherrer.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : inria-00337659, version 1

Collections

Citation

Bruno Scherrer, Shie Mannor. Error Reducing Sampling in Reinforcement Learning. NIPS-08 Workshop on Model Uncertainty and Risk in Reinforcement Learning, Dec 2008, Whistler, Canada. 2008. 〈inria-00337659〉

Partager

Métriques

Consultations de la notice

237

Téléchargements de fichiers

84