3543 articles – 5276 Notices  [english version]

inria-00162469, version 1

Une méthode de programmation linéaire mixte pour les POMDP décentralisé à horizon fini

Raghav Aras () 1, Alain Dutech () a1, François Charpillet () a1

2e Journées Francophones Planification, Décision, Apprentissage pour la conduite de systèmes - JFPDA 2007 (2007)

  • a –  INRIA
  • 1 :  MAIA (INRIA Lorraine - LORIA)

  • INRIA – CNRS : UMR7503 – Université Henri Poincaré - Nancy I – Université Nancy II – Institut National Polytechnique de Lorraine (INPL) France

Références bibliographiques

  • Type de publication : Communications avec actes
  • Domaine : Informatique/Intelligence artificielle
  • Titre : Une méthode de programmation linéaire mixte pour les POMDP décentralisé à horizon fini
  • Résumé : Nous nous intéressons au problème consistant à trouver une politique jointe optimale pour $n$ agents dans le cadre du contrôle optimal d'un processus décisionnel de Markov décentralisé partiellement observé (Dec-POMDP). Le principe de notre approche est le suivant~: la politique jointe optimale d'un Dec-POMDP est équivalente à une politique \emph{sous-optimale} du POMDP lié, politique qui devrait en outre respecter des contraintes structurelles afin qu'elle puisse être décentralisée. En s'appuyant sur ce principe, nous présentons un algorithme exact qui utilise la programmation linéaire mixte (PLM) pour trouver un vecteur de poids de réalisation de séquences jointes (suite d'actions et d'observations jointes) qui représente ainsi une politique jointe. La politique jointe (décentralisable) optimale pour le Dec-POMDP dérive directement de la solution de ce PLM. Des expérimentation de notre algorithme sur des problèmes de Dec-POMDP standards montrent qu'il est plus efficace (rapide) que les algorithmes exacts actuels de programmation dynamique.
  • Classification ACM :
    I.2.11.3: Multiagent systems
    I.: Computing Methodologies/I.2: ARTIFICIAL INTELLIGENCE/I.2.8: Problem Solving, Control Methods, and Search/I.2.8.2: Dynamic programming
    G.: Mathematics of Computing/G.1: NUMERICAL ANALYSIS/G.1.6: Optimization/G.1.6.6: Linear programming
    G.3.15: Stochastic processes
  • Classification autre : Dec-POMDP, Programmation linéaire, Syst. multi-agents
  • Langue du document : Français
  • Date de publication : 04/07/2007
  • Audience : nationale
  • Titre conférence : 2e Journées Francophones Planification, Décision, Apprentissage pour la conduite de systèmes - JFPDA 2007
  • Ville : Grenoble
  • Pays : France
  • Date conférence : 02/07/2007
  • Date conférence (fin) : 06/07/2007
  • Titre volume : JFPDA 2007
  • Mots-clés : Dec-POMDP – Programmation linéaire – Syst. multi-agents
  • Date de rédaction : 2007

Liste des fichiers attachés à ce document :

PDF
aras_milp_JFPDA07.pdf(146.8 KB)
 
  • inria-00162469, version 1
  • oai:hal.inria.fr:inria-00162469
  • Contributeur : 
  • Soumis le : Vendredi 13 Juillet 2007, 15:13:14
  • Dernière modification le : Lundi 20 Juin 2011, 11:38:37