Skip to Main content Skip to Navigation
Reports

On Markov Policies For Decentralized POMDPs

Jilles Steeve Dibangoye 1
1 CHROMA - Robots coopératifs et adaptés à la présence humaine en environnements dynamiques
Inria Grenoble - Rhône-Alpes, CITI - CITI Centre of Innovation in Telecommunications and Integration of services
Résumé : Cet article formule le problème du contrôle optimal décentralisé pour une classe de modèles mathématiques dans laquelle le système à contrôler est caractérisé par un processus de Markov à temps discret et à états finis. Les états de ce processus ne sont pas directement observables par les agents; ces derniers ont à leur disposition un ensemble d’observations lié de manière probabiliste à l’état du système. L’article démontre que, s’il ne reste qu’un nombre fini de pas de décision, la mesure de performance optimale d’une politique Markovienne est une fonction convexe, linéaire par morceaux, des probabilités d’observation courantes. En outre, sont décrits les algorithmes approchés d’exploitation de cette propriété pour le calcul de politiques Markoviennes et la mesure de performance associée pour tout horizon fini
Complete list of metadatas

Cited literature [33 references]  Display  Hide  Download

https://hal.inria.fr/hal-01860060
Contributor : Jilles Steeve Dibangoye <>
Submitted on : Wednesday, August 22, 2018 - 9:21:36 PM
Last modification on : Wednesday, July 8, 2020 - 12:43:51 PM
Document(s) archivé(s) le : Friday, November 23, 2018 - 3:45:30 PM

File

RR-9202.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : hal-01860060, version 1

Citation

Jilles Steeve Dibangoye. On Markov Policies For Decentralized POMDPs. [Research Report] RR-9202, INRIA Grenoble - Rhone-Alpes - CHROMA Team; CITI - CITI Centre of Innovation in Telecommunications and Integration of services; INSA Lyon. 2018. ⟨hal-01860060⟩

Share

Metrics

Record views

159

Files downloads

230