Skip to Main content Skip to Navigation
Documents associated with scientific events

Apprentissage par renforcement

Résumé : Dans un problème d'apprentissage par renforcement, un agent évoluant dans un environnement aléatoire doit cumuler un maximum de récompenses en choisissant au fil du temps la meilleure politique, c'est-à-dire la meilleure réaction possible à ses observations. Une telle situation est modélisée par un processus de décision markovien : on suppose que la suite des états que traverse l'agent est une chaîne de Markov dont les noyaux de transitions successifs sont déterminés par les actions choisies, et on admet que la récompense reçue à chaque instant est une fonction (aléatoires) de l'état courant. Quand les propriétés probabilistes de l'environnement sont connues, la détermination de la politique optimale, qui constitue le problème dit de planification, est typiquement un problème de programmation dynamique.
Document type :
Documents associated with scientific events
Complete list of metadata

https://hal.inria.fr/inria-00496719
Contributor : Conférence Mas2010 Connect in order to contact the contributor
Submitted on : Thursday, July 1, 2010 - 10:32:41 AM
Last modification on : Sunday, June 26, 2022 - 2:22:52 AM
Long-term archiving on: : Monday, October 22, 2012 - 5:15:51 PM

File

Renforcement.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : inria-00496719, version 1

Citation

Aurélien Garivier. Apprentissage par renforcement. Journées MAS et Journée en l'honneur de Jacques Neveu, Aug 2010, Talence, France. ⟨inria-00496719⟩

Share

Metrics

Record views

312

Files downloads

412