Error reducing sampling in reinforcement learning

Bruno Scherrer 1 Shie Mannor 2
1 MAIA - Autonomous intelligent machine
INRIA Lorraine, LORIA - Laboratoire Lorrain de Recherche en Informatique et ses Applications
Abstract : In reinforcement learning, an agent collects information interacting with an environment and uses it to derive a behavior. This paper focuses on efficient sampling; that is, the problem of choosing the interaction samples so that the corresponding behavior tends quickly to the optimal behavior. Our main result is a sensitivity analysis relating the choice of sampling any state-action pair to the decrease of an error bound on the optimal solution. We derive two new model-based algorithms. Simulations demonstrate a quicker convergence (in the sense of the number of samples) of the value function to the real optimal value function.
Type de document :
Rapport
[Research Report] 2004, pp.15
Liste complète des métadonnées

Littérature citée [14 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/inria-00098352
Contributeur : Bruno Scherrer <>
Soumis le : lundi 25 septembre 2006 - 16:13:18
Dernière modification le : jeudi 11 janvier 2018 - 06:19:51
Document(s) archivé(s) le : mardi 6 avril 2010 - 01:10:20

Fichiers

Identifiants

  • HAL Id : inria-00098352, version 1

Collections

Citation

Bruno Scherrer, Shie Mannor. Error reducing sampling in reinforcement learning. [Research Report] 2004, pp.15. 〈inria-00098352〉

Partager

Métriques

Consultations de la notice

189

Téléchargements de fichiers

110