Skip to Main content Skip to Navigation
Conference papers

Apprentissage de politiques efficaces avec XCSF et CEPS

Didier Marin 1, 2 Jérémie Decock 1 Lionel Rigoux 1, 2 Olivier Sigaud 1, 2
2 AMAC
ISIR - Institut des Systèmes Intelligents et de Robotique
Résumé : Nous proposons dans cette contribution une méthode qui permet d'obtenir une politique efficace dans un cadre où l'état et l'action sont continus. Le système contrôlé est un bras à deux degrés de liberté actionné par six muscles. Nous apprenons par démonstration une politique paramétrique avec le système de classeurs xcsf à partir de trajectoires quasi-optimales et nous étudions la capacité d'xcsf à généraliser ce qu'il a appris le long de ces trajectoires sur l'ensemble de l'espace atteignable. De plus, nous montrons qu'une méthode d'optimisation stochastique appelée Cross-Entropy Policy Search permet d'améliorer encore la performance du contrôleur paramétrique.
Document type :
Conference papers
Complete list of metadatas

https://hal.sorbonne-universite.fr/hal-00703774
Contributor : Didier Marin <>
Submitted on : Monday, June 4, 2012 - 1:08:59 PM
Last modification on : Wednesday, October 14, 2020 - 9:32:04 AM

Identifiers

  • HAL Id : hal-00703774, version 1

Citation

Didier Marin, Jérémie Decock, Lionel Rigoux, Olivier Sigaud. Apprentissage de politiques efficaces avec XCSF et CEPS. JFPDA 2011, 2011, Rouen, France. pp.298-310. ⟨hal-00703774⟩

Share

Metrics

Record views

282