hal-00643458, version 1
Des POMDPs avec des variables d'état visibles
5èmes Journées Francophones de Planification, Décision et Apprentissage pour la conduite de systèmes (2010)
Résumé : Les difficultés rencontrées dans les problèmes de décision séquentielle dans l'incertain sont souvent liées à la grande taille de l'espace d'états à considérer. Exploiter la structure du problème, par exemple en employant une représentation factorisée, est une approche souvent efficace mais, dans le cas des problèmes de décision markoviens partiellement observables, elle néglige un aspect important : le fait que certaines variables d'état peuvent être visibles. Dans le présent article nous proposons d'exploiter le fait que l'espace d'état peut-être factorisé en une partie visible et une partie cachée. En prenant l'exemple d'Incremental Pruning, nous montrons comment adapter des algorithmes classiques à cette factorisation et quels sont les bénéfices obtenus, entre autres sur la base de résultats expérimentaux.
- a – INRIA
- b – Université Nancy II
- 1 :
- INRIA – CNRS : UMR7503 – Université Henri Poincaré - Nancy I – Université Nancy II – Institut National Polytechnique de Lorraine (INPL)
- Domaine : Informatique/Système multi-agents
- Mots-clés : POMDP – factoring
- hal-00643458, version 1
- http://hal.inria.fr/hal-00643458
- oai:hal.inria.fr:hal-00643458
- Contributeur :
- Soumis le : Lundi 21 Novembre 2011, 23:36:26
- Dernière modification le : Mardi 22 Novembre 2011, 09:50:53



Documents associés
Exporter