Sensitivity Analysis in Particle Filters. Application to Policy Optimization in POMDPs

Pierre Arnaud Coquelin; Romain Deguest; Rémi Munos

Rapport (Rapport De Recherche) Année : 2008

Sensitivity Analysis in Particle Filters. Application to Policy Optimization in POMDPs

(1) , (1) , (2)

1
2

Pierre Arnaud Coquelin

Fonction : Auteur

Centre de Mathématiques Appliquées - Ecole Polytechnique

Romain Deguest

Fonction : Auteur

Centre de Mathématiques Appliquées - Ecole Polytechnique

Rémi Munos

Fonction : Auteur
PersonId : 836863

Sequential Learning

Résumé

Our setting is a Partially Observable Markov Decision Process with continuous state, observation and action spaces. Decisions are based on a Particle Filter for estimating the belief state given past observations. We consider a policy gradient approach for parameterized policy optimization. For that purpose, we investigate sensitivity analysis of the performance measure with respect to the parameters of the policy, focusing on Finite Difference (FD) techniques. We show that the naive FD is subject to variance explosion because of the non-smoothness of the resampling procedure. We propose a more sophisticated FD method which overcomes this problem and establish its consistency.

Mots clés

Partially Observable Markov Decision Problems sensitivity analysis particle filtering parametric optimization

Domaines

Apprentissage [cs.LG]

Fichier principal

RR6710.pdf (290.99 Ko)

Origine : Fichiers produits par l'(les) auteur(s)

Rémi Munos : Connectez-vous pour contacter le contributeur

https://inria.hal.science/inria-00336203

Soumis le : lundi 3 novembre 2008-11:14:21

Dernière modification le : vendredi 24 mars 2023-14:52:51

Archivage à long terme le : lundi 7 juin 2010-22:39:22

Dates et versions

inria-00336203 , version 1 (03-11-2008)

Identifiants

HAL Id : inria-00336203 , version 1

Citer

Pierre Arnaud Coquelin, Romain Deguest, Rémi Munos. Sensitivity Analysis in Particle Filters. Application to Policy Optimization in POMDPs. [Research Report] RR-6710, INRIA. 2008. ⟨inria-00336203⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

X UNIV-LILLE3 CNRS INRIA INRIA-RRRT X-CMAP X-DEP-MATHA LAGIS CMAP UVSQ INRIA2 LARA

177 Consultations

93 Téléchargements

Sensitivity Analysis in Particle Filters. Application to Policy Optimization in POMDPs

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager