Learning a Move-Generator for Upper Con dence Trees

Adrien Couetoux 1 Olivier Teytaud 1, 2 Hassen Doghmen 2
2 TAO - Machine Learning and Optimisation
CNRS - Centre National de la Recherche Scientifique : UMR8623, Inria Saclay - Ile de France, UP11 - Université Paris-Sud - Paris 11, LRI - Laboratoire de Recherche en Informatique
Abstract : We experiment the introduction of machine learning tools to improve Monte-Carlo Tree Search. More precisely, we propose the use of Direct Policy Search, a classical reinforcement learning paradigm, to learn the Monte-Carlo Move Generator. We experiment our algorithm on di erent forms of unit commitment problems, including experiments on a problem with both macrolevel and microlevel decisions.
Type de document :
Communication dans un congrès
International Computer Symposium 2012, Dec 2012, Hualien, Taiwan. 2012
Liste complète des métadonnées

Littérature citée [17 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/hal-00759822
Contributeur : Adrien Couetoux <>
Soumis le : lundi 3 décembre 2012 - 04:50:42
Dernière modification le : jeudi 5 avril 2018 - 12:30:12
Document(s) archivé(s) le : lundi 4 mars 2013 - 03:44:37

Fichier

uctWithDPS.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-00759822, version 1

Collections

Citation

Adrien Couetoux, Olivier Teytaud, Hassen Doghmen. Learning a Move-Generator for Upper Con dence Trees. International Computer Symposium 2012, Dec 2012, Hualien, Taiwan. 2012. 〈hal-00759822〉

Partager

Métriques

Consultations de la notice

475

Téléchargements de fichiers

298