Optimisme en apprentissage par renforcement et divergence de Kullback-Leibler

Abstract : We consider model-based reinforcement learning in finite Markov Decision Processes (MDPs), focussing on so-called optimistic strategies.
Type de document :
Documents associés à des manifestations scientifiques -- Hal-inria+
Journées MAS et Journée en l'honneur de Jacques Neveu, Aug 2010, Talence, France
Liste complète des métadonnées

https://hal.inria.fr/inria-00510327
Contributeur : Conférence Mas2010 <>
Soumis le : mercredi 18 août 2010 - 09:45:08
Dernière modification le : jeudi 11 janvier 2018 - 06:23:38
Document(s) archivé(s) le : vendredi 19 novembre 2010 - 02:31:53

Fichier

REN-Filippi.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : inria-00510327, version 1

Citation

Sarah Filippi, Olivier Cappé, Aurelien Garivier. Optimisme en apprentissage par renforcement et divergence de Kullback-Leibler. Journées MAS et Journée en l'honneur de Jacques Neveu, Aug 2010, Talence, France. 〈inria-00510327〉

Partager

Métriques

Consultations de la notice

174

Téléchargements de fichiers

60