Optimisme en apprentissage par renforcement et divergence de Kullback-Leibler - Inria - Institut national de recherche en sciences et technologies du numérique Accéder directement au contenu
Document Associé À Des Manifestations Scientifiques Année : 2010

Optimisme en apprentissage par renforcement et divergence de Kullback-Leibler

Résumé

We consider model-based reinforcement learning in finite Markov Decision Processes (MDPs), focussing on so-called optimistic strategies.
Fichier principal
Vignette du fichier
REN-Filippi.pdf (67.44 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

inria-00510327 , version 1 (18-08-2010)

Identifiants

  • HAL Id : inria-00510327 , version 1

Citer

Sarah Filippi, Olivier Cappé, Aurélien Garivier. Optimisme en apprentissage par renforcement et divergence de Kullback-Leibler. Journées MAS et Journée en l'honneur de Jacques Neveu, Aug 2010, Talence, France. ⟨inria-00510327⟩
155 Consultations
57 Téléchargements

Partager

Gmail Facebook X LinkedIn More