Optimisme en apprentissage par renforcement et divergence de Kullback-Leibler

Sarah Filippi; Olivier Cappé; Aurélien Garivier

Document Associé À Des Manifestations Scientifiques Année : 2010

Optimisme en apprentissage par renforcement et divergence de Kullback-Leibler

(1) , (1) , (1)

Sarah Filippi

Fonction : Auteur
PersonId : 862433

Laboratoire Traitement et Communication de l'Information

Olivier Cappé

Fonction : Auteur
PersonId : 1534
IdHAL : olivier-cappe
ORCID : 0000-0001-7415-8669
IdRef : 057106878

Laboratoire Traitement et Communication de l'Information

Aurélien Garivier

Fonction : Auteur
PersonId : 4986
IdHAL : aurelien-garivier
ORCID : 0000-0002-4906-9573
IdRef : 111902495

Laboratoire Traitement et Communication de l'Information

Résumé

We consider model-based reinforcement learning in finite Markov Decision Processes (MDPs), focussing on so-called optimistic strategies.

Domaines

Statistiques [math.ST] Théorie [stat.TH]

Fichier principal

REN-Filippi.pdf (67.44 Ko)

Origine : Fichiers produits par l'(les) auteur(s)

Conférence Mas2010 : Connectez-vous pour contacter le contributeur

https://inria.hal.science/inria-00510327

Soumis le : mercredi 18 août 2010-09:45:08

Dernière modification le : lundi 9 octobre 2023-12:49:40

Archivage à long terme le : vendredi 19 novembre 2010-02:31:53

Dates et versions

inria-00510327 , version 1 (18-08-2010)

Identifiants

HAL Id : inria-00510327 , version 1

Citer

Sarah Filippi, Olivier Cappé, Aurélien Garivier. Optimisme en apprentissage par renforcement et divergence de Kullback-Leibler. Journées MAS et Journée en l'honneur de Jacques Neveu, Aug 2010, Talence, France. ⟨inria-00510327⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

INSTITUT-TELECOM CNRS INSMI PARISTECH MAS2010 LTCI

155 Consultations

57 Téléchargements

Optimisme en apprentissage par renforcement et divergence de Kullback-Leibler

Résumé

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager