Learning a Move-Generator for Upper Con dence Trees - Inria - Institut national de recherche en sciences et technologies du numérique Accéder directement au contenu
Communication Dans Un Congrès Année : 2012

Learning a Move-Generator for Upper Con dence Trees

Résumé

We experiment the introduction of machine learning tools to improve Monte-Carlo Tree Search. More precisely, we propose the use of Direct Policy Search, a classical reinforcement learning paradigm, to learn the Monte-Carlo Move Generator. We experiment our algorithm on di erent forms of unit commitment problems, including experiments on a problem with both macrolevel and microlevel decisions.
Fichier principal
Vignette du fichier
uctWithDPS.pdf (220 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-00759822 , version 1 (03-12-2012)

Identifiants

  • HAL Id : hal-00759822 , version 1

Citer

Adrien Couetoux, Olivier Teytaud, Hassen Doghmen. Learning a Move-Generator for Upper Con dence Trees. International Computer Symposium 2012, Dec 2012, Hualien, Taiwan. ⟨hal-00759822⟩
282 Consultations
289 Téléchargements

Partager

Gmail Facebook X LinkedIn More