Continuous Rapid Action Value Estimates

Adrien Couetoux 1 Mario Milone 1 Matyas Brendel 2 Hassen Doghmen 2 Michèle Sebag 2, 1 Olivier Teytaud 1, 2
2 TAO - Machine Learning and Optimisation
CNRS - Centre National de la Recherche Scientifique : UMR8623, Inria Saclay - Ile de France, UP11 - Université Paris-Sud - Paris 11, LRI - Laboratoire de Recherche en Informatique
Abstract : In the last decade, Monte-Carlo Tree Search (MCTS) has revolutionized the domain of large-scale Markov Decision Process problems. MCTS most often uses the Upper Confidence Tree algorithm to handle the exploration versus exploitation trade-off, while a few heuristics are used to guide the exploration in large search spaces. Among these heuristics is Rapid Action Value Estimate (RAVE). This paper is concerned with extending the RAVE heuristics to continuous action and state spaces. The approach is experimentally validated on two artificial benchmark problems: the treasure hunt game, and a real-world energy management problem.
Type de document :
Communication dans un congrès
Chun-Nan Hsu and Wee Sun Lee. The 3rd Asian Conference on Machine Learning (ACML2011), Nov 2011, Taoyuan, Taiwan. JMLR, 20, pp.19-31, 2011, Workshop and Conference Proceedings
Liste complète des métadonnées

Littérature citée [16 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/hal-00642459
Contributeur : Olivier Teytaud <>
Soumis le : mercredi 23 novembre 2011 - 03:31:28
Dernière modification le : jeudi 11 janvier 2018 - 06:22:14
Document(s) archivé(s) le : vendredi 16 novembre 2012 - 11:51:15

Fichier

couetoux.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-00642459, version 1

Citation

Adrien Couetoux, Mario Milone, Matyas Brendel, Hassen Doghmen, Michèle Sebag, et al.. Continuous Rapid Action Value Estimates. Chun-Nan Hsu and Wee Sun Lee. The 3rd Asian Conference on Machine Learning (ACML2011), Nov 2011, Taoyuan, Taiwan. JMLR, 20, pp.19-31, 2011, Workshop and Conference Proceedings. 〈hal-00642459〉

Partager

Métriques

Consultations de la notice

373

Téléchargements de fichiers

440