Une méthode de programmation linéaire mixte pour les POMDP décentralisé à horizon fini

Raghav Aras 1 Alain Dutech 1 François Charpillet 1
1 MAIA - Autonomous intelligent machine
INRIA Lorraine, LORIA - Laboratoire Lorrain de Recherche en Informatique et ses Applications
Résumé : Nous nous intéressons au problème consistant à trouver une politique jointe optimale pour $n$ agents dans le cadre du contrôle optimal d'un processus décisionnel de Markov décentralisé partiellement observé (Dec-POMDP). Le principe de notre approche est le suivant~: la politique jointe optimale d'un Dec-POMDP est équivalente à une politique \emph{sous-optimale} du POMDP lié, politique qui devrait en outre respecter des contraintes structurelles afin qu'elle puisse être décentralisée. En s'appuyant sur ce principe, nous présentons un algorithme exact qui utilise la programmation linéaire mixte (PLM) pour trouver un vecteur de poids de réalisation de séquences jointes (suite d'actions et d'observations jointes) qui représente ainsi une politique jointe. La politique jointe (décentralisable) optimale pour le Dec-POMDP dérive directement de la solution de ce PLM. Des expérimentation de notre algorithme sur des problèmes de Dec-POMDP standards montrent qu'il est plus efficace (rapide) que les algorithmes exacts actuels de programmation dynamique.
Type de document :
Communication dans un congrès
2e Journées Francophones Planification, Décision, Apprentissage pour la conduite de systèmes - JFPDA 2007, Jul 2007, Grenoble, France. 2007, JFPDA 2007
Liste complète des métadonnées

Littérature citée [8 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/inria-00162469
Contributeur : Alain Dutech <>
Soumis le : vendredi 13 juillet 2007 - 15:13:14
Dernière modification le : jeudi 11 janvier 2018 - 06:19:51
Document(s) archivé(s) le : jeudi 8 avril 2010 - 23:11:37

Fichier

aras_milp_JFPDA07.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : inria-00162469, version 1

Collections

Citation

Raghav Aras, Alain Dutech, François Charpillet. Une méthode de programmation linéaire mixte pour les POMDP décentralisé à horizon fini. 2e Journées Francophones Planification, Décision, Apprentissage pour la conduite de systèmes - JFPDA 2007, Jul 2007, Grenoble, France. 2007, JFPDA 2007. 〈inria-00162469〉

Partager

Métriques

Consultations de la notice

270

Téléchargements de fichiers

166