Résumé : Nous présentons un nouvel algorithme de planification pour la construction de systèmes multi-agents réactifs et situés pouvant se modéliser par des processus de décision de Markov décentralisés (DEC-POMDP). Cet algorithme est fondé sur la programmation dynamique à base de points. Il est dérivé de techniques de programmation dynamique optimale utilisées pour résoudre des jeux stochastiques partiellement observables(POSG) et des techniques d'approximation utilisées pour résoudre des POMDP mono-agents. Nous montrons pour la première fois qu'il est possible de déterminer un ensemble d'états de croyance multi-agent pertinents, et nous montrons comment ce calcul permet ensuite d'éviter le recours à la programmation linéaire très couteuse dans le cas multi-agent. Nous détaillons une version exacte et une version approximative de notre algorithme, et nous montrons son efficacité sur un exemple de la littérature.
https://hal.inria.fr/inria-00104450
Contributeur : Daniel Szer <>
Soumis le : vendredi 6 octobre 2006 - 15:35:47
Dernière modification le : mardi 25 octobre 2016 - 17:00:27
Document(s) archivé(s) le : mardi 6 avril 2010 - 18:51:45
Daniel Szer, François Charpillet. Programmation dynamique à base de points pour la résolution des DEC-POMDPs. 14èmes Journées Francophones sur les Systèmes Multi-Agents - JFSMA'2006, Oct 2006, Annecy, France. 2006. <inria-00104450>