Performance bound for Approximate Optimistic Policy Iteration

Bruno Scherrer 1 Christophe Thiery 1
1 MAIA - Autonomous intelligent machine
INRIA Lorraine, LORIA - Laboratoire Lorrain de Recherche en Informatique et ses Applications
Abstract : We provide a proof of the performance bound theorem published in "Least-Squares λ Policy Iteration: Bias-Variance Trade-off in Control Problems" (ICML 2010).
Type de document :
Rapport
[Technical Report] 2010
Liste complète des métadonnées

https://hal.inria.fr/inria-00480952
Contributeur : Christophe Thiery <>
Soumis le : mercredi 5 mai 2010 - 14:56:27
Dernière modification le : jeudi 11 janvier 2018 - 06:19:51
Document(s) archivé(s) le : jeudi 16 septembre 2010 - 13:36:05

Fichier

opi_proof.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : inria-00480952, version 1

Collections

Citation

Bruno Scherrer, Christophe Thiery. Performance bound for Approximate Optimistic Policy Iteration. [Technical Report] 2010. 〈inria-00480952〉

Partager

Métriques

Consultations de la notice

341

Téléchargements de fichiers

174