HAL will be down for maintenance from Friday, June 10 at 4pm through Monday, June 13 at 9am. More information
Skip to Main content Skip to Navigation
Conference papers

Apprentissage de politiques efficaces avec XCSF et CEPS

Didier Marin 1, 2 Jérémie Decock 1 Lionel Rigoux 1, 2 Olivier Sigaud 1, 2
2 AMAC
ISIR - Institut des Systèmes Intelligents et de Robotique
Résumé : Nous proposons dans cette contribution une méthode qui permet d'obtenir une politique efficace dans un cadre où l'état et l'action sont continus. Le système contrôlé est un bras à deux degrés de liberté actionné par six muscles. Nous apprenons par démonstration une politique paramétrique avec le système de classeurs xcsf à partir de trajectoires quasi-optimales et nous étudions la capacité d'xcsf à généraliser ce qu'il a appris le long de ces trajectoires sur l'ensemble de l'espace atteignable. De plus, nous montrons qu'une méthode d'optimisation stochastique appelée Cross-Entropy Policy Search permet d'améliorer encore la performance du contrôleur paramétrique.
Document type :
Conference papers
Complete list of metadata

https://hal.sorbonne-universite.fr/hal-00703774
Contributor : Didier Marin Connect in order to contact the contributor
Submitted on : Monday, June 4, 2012 - 1:08:59 PM
Last modification on : Saturday, January 22, 2022 - 3:01:52 AM

Identifiers

  • HAL Id : hal-00703774, version 1

Citation

Didier Marin, Jérémie Decock, Lionel Rigoux, Olivier Sigaud. Apprentissage de politiques efficaces avec XCSF et CEPS. JFPDA 2011, 2011, Rouen, France. pp.298-310. ⟨hal-00703774⟩

Share

Metrics

Record views

108