Finite sample analysis of Least Squares Temporal Differences

Rémi Munos 1
1 SEQUEL - Sequential Learning
LIFL - Laboratoire d'Informatique Fondamentale de Lille, LAGIS - Laboratoire d'Automatique, Génie Informatique et Signal, Inria Lille - Nord Europe
Résumé : L'exposé commencera par une brève introduction à l'apprentissage par renforcement, en insistant sur le compromis exploration-exploitation.
Document type :
Documents associated with scientific events
Complete list of metadatas

https://hal.inria.fr/inria-00510324
Contributor : Conférence Mas2010 <>
Submitted on : Wednesday, August 18, 2010 - 9:40:18 AM
Last modification on : Thursday, February 21, 2019 - 10:52:49 AM
Long-term archiving on : Friday, November 19, 2010 - 2:30:20 AM

File

REN-Munos.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : inria-00510324, version 1

Collections

Citation

Rémi Munos. Finite sample analysis of Least Squares Temporal Differences. Journées MAS et Journée en l'honneur de Jacques Neveu, Aug 2010, Talence, France. ⟨inria-00510324⟩

Share

Metrics

Record views

384

Files downloads

59