Programmation dynamique à mémoire bornée avec distribution sur les croyances pour les Dec-POMDPs

Gabriel Corona; François Charpillet

Communication Dans Un Congrès Année : 2009

Programmation dynamique à mémoire bornée avec distribution sur les croyances pour les Dec-POMDPs

(1) , (1)

Gabriel Corona

Fonction : Auteur
PersonId : 865260

Autonomous intelligent machine

François Charpillet

Fonction : Auteur
PersonId : 1910
IdHAL : francois-charpillet
ORCID : 0000-0001-8260-1536
IdRef : 070140553

Autonomous intelligent machine

Résumé

Nous proposons une approche heuristique pour calculer une politique approchée d'un Dec-POMDP. Il s'agit d'une approche par programmation dynamique à base de points dans la lignée des algorithmes PBDP \citep{szer2006a}, MBDP \citep{seuken2007a} et IMBDP \citep{seuken2007b} : Elle formule le choix des politiques retenues à chaque étape de la construction comme un problème d'optimisation. Le critère de ce problème repose sur une estimation de la distribution de probabilité {\em a priori} des croyances atteignables pour un horizon donné : Il s'agit de maximiser l'espérance des récompenses cumulées pour l'horizon considéré étant donné cette distribution. L'estimation de cette espérance peut se faire par échantillonnage des croyances en simulant une politique heuristique.

Mots clés

Dec-POMDP planification multi-agent programmation dynamique optimisation combinatoire Monte-Carlo Importance Sampling

Domaines

Intelligence artificielle [cs.AI]

Fichier principal

article.pdf (101.41 Ko)

Origine : Fichiers produits par l'(les) auteur(s)

Gabriel Corona : Connectez-vous pour contacter le contributeur

https://inria.hal.science/inria-00439053

Soumis le : samedi 5 décembre 2009-20:17:17

Dernière modification le : jeudi 15 février 2024-03:32:16

Archivage à long terme le : jeudi 18 octobre 2012-10:05:28

Dates et versions

inria-00439053 , version 1 (05-12-2009)

Identifiants

HAL Id : inria-00439053 , version 1

Citer

Gabriel Corona, François Charpillet. Programmation dynamique à mémoire bornée avec distribution sur les croyances pour les Dec-POMDPs. Journées Francophones Planification Décision Apprentissage (JFPDA 2009), Olivier Sigaud and Michèle Vié, Jun 2009, Paris, France. pp.7. ⟨inria-00439053⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

UNIV-RENNES1 CNRS INRIA IRISA UNIV-LORRAINE INRIA2 LORIA UR1-MATH-STIC UR1-UFR-ISTIC UNIV-RENNES UR1-MATH-NUM

90 Consultations

89 Téléchargements

Programmation dynamique à mémoire bornée avec distribution sur les croyances pour les Dec-POMDPs

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager