Une approche modifiée de Lambda-Policy Iteration

Christophe Thiery 1 Bruno Scherrer 1
1 MAIA - Autonomous intelligent machine
INRIA Lorraine, LORIA - Laboratoire Lorrain de Recherche en Informatique et ses Applications
Résumé : Dans le cadre du contrôle optimal stochastique, nous proposons une manière modifiée de mettre en oeuvre l'algorithme λ-Policy Iteration (Bertsekas & Tsitsiklis, 1996), une méthode qui généralise Value Iteration et Policy Iteration en introduisant un paramètre λ. Nous montrons que cette version modifiée, qui est analogue à Modified Policy Iteration, généralise tous ces algorithmes et converge vers la fonction de valeur optimale. En nous appuyant sur des arguments analytiques et expérimentaux, nous mettons en évidence le fait que lorsque l'algorithme est appliqué de manière exacte, le paramètre λ ne permet pas d'améliorer la vitesse de convergence de manière significative.
Type de document :
Communication dans un congrès
Journées Francophones Planification Décision Apprentissage, Jun 2009, Paris, France. 2009, 〈http://webia.lip6.fr/~sigaud/thiery.pdf〉
Liste complète des métadonnées

https://hal.inria.fr/inria-00418910
Contributeur : Christophe Thiery <>
Soumis le : mardi 22 septembre 2009 - 11:20:46
Dernière modification le : jeudi 11 janvier 2018 - 06:19:50
Document(s) archivé(s) le : jeudi 30 juin 2011 - 11:48:52

Fichier

thiery-christophe.pdf
Accord explicite pour ce dépôt

Identifiants

  • HAL Id : inria-00418910, version 1

Collections

Citation

Christophe Thiery, Bruno Scherrer. Une approche modifiée de Lambda-Policy Iteration. Journées Francophones Planification Décision Apprentissage, Jun 2009, Paris, France. 2009, 〈http://webia.lip6.fr/~sigaud/thiery.pdf〉. 〈inria-00418910〉

Partager

Métriques

Consultations de la notice

403

Téléchargements de fichiers

251