Rolling horizon procedures in Semi-Markov Games: The Discounted Case

Eugenio Della Vecchia; Silvia C. Di Marco; Alain Jean-Marie

Rapport (Rapport De Recherche) Année : 2012

Rolling horizon procedures in Semi-Markov Games: The Discounted Case

(1) , (1) , (2, 3)

1
2
3

Eugenio Della Vecchia

Fonction : Auteur

Facultad de Ciencias Exactas, Ingenieria y Agrimensura [Rosario]

Silvia C. Di Marco

Fonction : Auteur

Facultad de Ciencias Exactas, Ingenieria y Agrimensura [Rosario]

Alain Jean-Marie

Fonction : Auteur
PersonId : 1711
IdHAL : alain-jean-marie
ORCID : 0000-0002-9210-4530
IdRef : 059937386

Models for the performance analysis and the control of networks

Hors Équipe

Résumé

We study the properties of the rolling horizon and the approximate rolling horizon procedures for the case of two-person zero-sum discounted semi-Markov games with infi nite horizon, under several assumptions on the reward function, when the state space is a borelian set and the action spaces are considered compact. Under suitable conditions, we prove that the equilibrium is the unique solution of its dynamic programming equation, and we prove bounds which imply the convergence of the procedures when the horizon length tends to in finity. The approach is based on the formalism for Semi-Markov games developed by Luque-Vásquez, together with extensions of the results of Hernández-Lerma and Lasserre for Markov Decision Processes and Chang and Marcus for Markov Games, both in discrete time. In this way we generalize the results on the rolling horizon and approximate rolling horizon procedures previously obtained for discrete-time problems.

Nous étudions les propriétés de la procédure de décision à horizon roulant et une approximation de cette procédure, pour le cas de jeux semi-Markoviens à somme nulle avec horizon in fini et actualisation, sous diff érentes hypothèses concernant la fonction de récompense, quand l'espace d'états est un ensemble borélien et les espaces d'actions sont compacts. Sous des hypothèses appropriées, nous montrons que l'équilibre est l'unique solution de l'équation de programmation dynamique associée au jeu, puis nous prouvons des bornes d'erreur impliquant la convergence des procédures quand l'horizon de programmation tend vers l'infi ni. Notre approche est basée sur le formalisme pour les jeux semi-Markoviens développé par Luque-Vásquez, joint à des extensions des résultats de Hernández-Lerma et Lasserre pour les processus de décision Markoviens et Chang et Marcus pour les jeux Markoviens, ces deux derniers travaux étant en temps discret. De cette façon, nous généralisons les résultats sur la procédure à horizon roulant obtenus pour les problèmes en temps discret.

Mots clés

Semi-Markov games Rolling horizon procedures

Domaines

Optimisation et contrôle [math.OC]

Fichier principal

rr2_220514.pdf (718.97 Ko)

Origine : Fichiers produits par l'(les) auteur(s)

Alain Jean-Marie : Connectez-vous pour contacter le contributeur

https://inria.hal.science/hal-00720351

Soumis le : jeudi 22 mai 2014-15:03:40

Dernière modification le : mercredi 24 avril 2024-15:05:39

Archivage à long terme le : vendredi 22 août 2014-12:45:27

Dates et versions

hal-00720351 , version 1 (25-07-2012)

hal-00720351 , version 2 (22-05-2014)

Identifiants

HAL Id : hal-00720351 , version 2

Citer

Eugenio Della Vecchia, Silvia C. Di Marco, Alain Jean-Marie. Rolling horizon procedures in Semi-Markov Games: The Discounted Case. [Research Report] RR-8019, INRIA. 2012. ⟨hal-00720351v2⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

CNRS INRIA INRIA-RRRT LIRMM INRIA2 HORSEQUIPE TDS-MACS LARA MIPS UNIV-MONTPELLIER

288 Consultations

263 Téléchargements

Rolling horizon procedures in Semi-Markov Games: The Discounted Case

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager