Une approche modifiée de Lambda-Policy Iteration

Christophe Thiery; Bruno Scherrer

Communication Dans Un Congrès Année : 2009

Une approche modifiée de Lambda-Policy Iteration

(1) , (1)

Christophe Thiery

Fonction : Auteur
PersonId : 842769

Autonomous intelligent machine

Bruno Scherrer

Fonction : Auteur
PersonId : 1406
IdHAL : bruno-scherrer
IdRef : 073360708

Autonomous intelligent machine

Résumé

Dans le cadre du contrôle optimal stochastique, nous proposons une manière modifiée de mettre en oeuvre l'algorithme λ-Policy Iteration (Bertsekas & Tsitsiklis, 1996), une méthode qui généralise Value Iteration et Policy Iteration en introduisant un paramètre λ. Nous montrons que cette version modifiée, qui est analogue à Modified Policy Iteration, généralise tous ces algorithmes et converge vers la fonction de valeur optimale. En nous appuyant sur des arguments analytiques et expérimentaux, nous mettons en évidence le fait que lorsque l'algorithme est appliqué de manière exacte, le paramètre λ ne permet pas d'améliorer la vitesse de convergence de manière significative.

Mots clés

Contrôle optimal stochastique Apprentissage par renforcement Programmation dynamique Processus Décisionnels de Markov Modified λ-Policy Iteration

Domaines

Intelligence artificielle [cs.AI]

Fichier principal

thiery-christophe.pdf (109.51 Ko)

Origine : Accord explicite pour ce dépôt

Christophe Thiery : Connectez-vous pour contacter le contributeur

https://inria.hal.science/inria-00418910

Soumis le : mardi 22 septembre 2009-11:20:46

Dernière modification le : vendredi 24 mars 2023-14:52:52

Archivage à long terme le : jeudi 30 juin 2011-11:48:52

Dates et versions

inria-00418910 , version 1 (22-09-2009)

Identifiants

HAL Id : inria-00418910 , version 1

Citer

Christophe Thiery, Bruno Scherrer. Une approche modifiée de Lambda-Policy Iteration. Journées Francophones Planification Décision Apprentissage, UPMC-Paris 6, Jun 2009, Paris, France. ⟨inria-00418910⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

CNRS INRIA UNIV-LORRAINE INRIA2 LORIA

172 Consultations

192 Téléchargements

Une approche modifiée de Lambda-Policy Iteration

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager