Modified policy iteration algorithms are not strongly polynomial for discounted dynamic programming

Eugene A. Feinberg; Jefferson Huang; Bruno Scherrer

doi:10.1016/j.orl.2014.07.006

Article Dans Une Revue Operations Research Letters Année : 2014

Modified policy iteration algorithms are not strongly polynomial for discounted dynamic programming

(1) , (1) , (2)

1
2

Eugene A. Feinberg

Fonction : Auteur

Stony Brook University [SUNY]

Jefferson Huang

Fonction : Auteur

Stony Brook University [SUNY]

Bruno Scherrer

Fonction : Auteur

Autonomous intelligent machine

Résumé

This note shows that the number of arithmetic operations required by any member of a broad class of optimistic policy iteration algorithms to solve a deterministic discounted dynamic programming problem with three states and four actions may grow arbitrarily. Therefore any such algorithm is not strongly polynomial. In particular, the modified policy iteration and $\lambda$-policy iteration algorithms are not strongly polynomial.

Mots clés

Markov decision process Modified policy iteration Strongly polynomial Policy Algorithm

Domaines

Intelligence artificielle [cs.AI]

Fichier principal

Feinberg_Huang_Scherrer.pdf (106.54 Ko)

Origine : Fichiers produits par l'(les) auteur(s)

Bruno Scherrer : Connectez-vous pour contacter le contributeur

https://inria.hal.science/hal-01091370

Soumis le : vendredi 5 décembre 2014-11:48:44

Dernière modification le : lundi 11 septembre 2023-17:41:18

Archivage à long terme le : lundi 9 mars 2015-06:02:58

Dates et versions

hal-01091370 , version 1 (05-12-2014)

Identifiants

HAL Id : hal-01091370 , version 1
DOI : 10.1016/j.orl.2014.07.006

Citer

Eugene A. Feinberg, Jefferson Huang, Bruno Scherrer. Modified policy iteration algorithms are not strongly polynomial for discounted dynamic programming. Operations Research Letters, 2014, 42, pp.429 - 431. ⟨10.1016/j.orl.2014.07.006⟩. ⟨hal-01091370⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

CNRS INRIA UNIV-LORRAINE INRIA2 LORIA LORIA-AIS

404 Consultations

433 Téléchargements

Modified policy iteration algorithms are not strongly polynomial for discounted dynamic programming

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Altmetric

Partager