Online Regret Bounds for Undiscounted Continuous Reinforcement Learning

Ronald Ortner; Daniil Ryabko

Communication Dans Un Congrès Année : 2012

Online Regret Bounds for Undiscounted Continuous Reinforcement Learning

(1) , (2)

1
2

Ronald Ortner

Fonction : Auteur

Montanuniversität Leoben

Daniil Ryabko

Fonction : Auteur
PersonId : 848126

Sequential Learning

Domaines

Intelligence artificielle [cs.AI]

Daniil Ryabko : Connectez-vous pour contacter le contributeur

https://inria.hal.science/hal-00765441

Soumis le : vendredi 14 décembre 2012-15:59:32

Dernière modification le : jeudi 15 février 2024-03:32:06

Dates et versions

hal-00765441 , version 1 (14-12-2012)

Identifiants

HAL Id : hal-00765441 , version 1

Citer

Ronald Ortner, Daniil Ryabko. Online Regret Bounds for Undiscounted Continuous Reinforcement Learning. NIPS 2012, 2012, Lake Tahoe, United States. pp.1772--1780. ⟨hal-00765441⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

UNIV-RENNES1 UNIV-LILLE3 CNRS INRIA IRISA LAGIS INRIA2 UR1-MATH-STIC UR1-UFR-ISTIC UNIV-RENNES UR1-MATH-NUM

6800 Consultations

0 Téléchargements

Online Regret Bounds for Undiscounted Continuous Reinforcement Learning

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager