Une approche modifiée de Lambda-Policy Iteration - Inria - Institut national de recherche en sciences et technologies du numérique Accéder directement au contenu
Communication Dans Un Congrès Année : 2009

Une approche modifiée de Lambda-Policy Iteration

Christophe Thiery
  • Fonction : Auteur
  • PersonId : 842769
Bruno Scherrer

Résumé

Dans le cadre du contrôle optimal stochastique, nous proposons une manière modifiée de mettre en oeuvre l'algorithme λ-Policy Iteration (Bertsekas & Tsitsiklis, 1996), une méthode qui généralise Value Iteration et Policy Iteration en introduisant un paramètre λ. Nous montrons que cette version modifiée, qui est analogue à Modified Policy Iteration, généralise tous ces algorithmes et converge vers la fonction de valeur optimale. En nous appuyant sur des arguments analytiques et expérimentaux, nous mettons en évidence le fait que lorsque l'algorithme est appliqué de manière exacte, le paramètre λ ne permet pas d'améliorer la vitesse de convergence de manière significative.
Fichier principal
Vignette du fichier
thiery-christophe.pdf (109.51 Ko) Télécharger le fichier
Origine : Accord explicite pour ce dépôt

Dates et versions

inria-00418910 , version 1 (22-09-2009)

Identifiants

  • HAL Id : inria-00418910 , version 1

Citer

Christophe Thiery, Bruno Scherrer. Une approche modifiée de Lambda-Policy Iteration. Journées Francophones Planification Décision Apprentissage, UPMC-Paris 6, Jun 2009, Paris, France. ⟨inria-00418910⟩
172 Consultations
192 Téléchargements

Partager

Gmail Facebook X LinkedIn More