Online Regret Bounds for Undiscounted Continuous Reinforcement Learning

Ronald Ortner 1 Daniil Ryabko 2
2 SEQUEL - Sequential Learning
LIFL - Laboratoire d'Informatique Fondamentale de Lille, Inria Lille - Nord Europe, LAGIS - Laboratoire d'Automatique, Génie Informatique et Signal
Type de document :
Communication dans un congrès
P. Bartlett and F.C.N. Pereira and C.J.C. Burges and L. Bottou and K.Q. Weinberger. NIPS 2012, 2012, Lake Tahoe, United States. pp.1772--1780, 2012, Advances in Neural Information Processing Systems 25
Liste complète des métadonnées

https://hal.inria.fr/hal-00765441
Contributeur : Daniil Ryabko <>
Soumis le : vendredi 14 décembre 2012 - 15:59:32
Dernière modification le : jeudi 11 janvier 2018 - 06:22:13

Identifiants

  • HAL Id : hal-00765441, version 1

Collections

Citation

Ronald Ortner, Daniil Ryabko. Online Regret Bounds for Undiscounted Continuous Reinforcement Learning. P. Bartlett and F.C.N. Pereira and C.J.C. Burges and L. Bottou and K.Q. Weinberger. NIPS 2012, 2012, Lake Tahoe, United States. pp.1772--1780, 2012, Advances in Neural Information Processing Systems 25. 〈hal-00765441〉

Partager

Métriques

Consultations de la notice

4124