Absorbing Markov Decision Processes

François Dufour; Tomás Prieto-Rumeau

Article Dans Une Revue ESAIM: Control, Optimisation and Calculus of Variations Année : 2024

Absorbing Markov Decision Processes

(1, 2, 3) ,

1
2
3

François Dufour

Fonction : Auteur
PersonId : 12044
IdHAL : francois-dufour
ORCID : 0000-0001-6653-2024
IdRef : 127261680

Méthodes avancées d’apprentissage statistique et de contrôle

Institut de Mathématiques de Bordeaux

Institut Polytechnique de Bordeaux

Tomás Prieto-Rumeau

Fonction : Auteur
PersonId : 773008
ORCID : 0000-0003-4677-4725

Résumé

In this paper, we study discrete-time absorbing Markov Decision Processes (MDP) with measurable state space and Borel action space with a given initial distribution. For such models, solutions to the characteristic equation that are not occupation measures may exist. Several necessary and sufficient conditions are provided to guarantee that any solution to the characteristic equation is an occupation measure. Under the so-called continuity-compactness conditions, we first show that a measure is precisely an occupation measure if and only if it satisfies the characteristic equation and an additional absolute continuity condition. Secondly, it is shown that the set of occupation measures is compact in the weak-strong topology if and only if the model is uniformly absorbing. Several examples are provided to illustrate our results.

Domaines

Mathématiques [math]

François Dufour : Connectez-vous pour contacter le contributeur

https://inria.hal.science/hal-04377071

Soumis le : dimanche 7 janvier 2024-14:26:41

Dernière modification le : samedi 27 avril 2024-03:10:16

Dates et versions

hal-04377071 , version 1 (07-01-2024)

Licence

Paternité

Identifiants

HAL Id : hal-04377071 , version 1

Citer

François Dufour, Tomás Prieto-Rumeau. Absorbing Markov Decision Processes. ESAIM: Control, Optimisation and Calculus of Variations, In press. ⟨hal-04377071⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

CNRS INRIA IMB INSMI INRIA2

28 Consultations

0 Téléchargements

Absorbing Markov Decision Processes

Résumé

Domaines

Dates et versions

Licence

Identifiants

Citer

Exporter

Collections

Partager