inria-00287883, version 1
Introduction de connaissances expertes en Bandit-Based Monte-Carlo Planning avec application au Computer-Go
Louis Chatriot 1Sylvain Gelly 1, 2Jean-Baptiste Hoock 1Julien Pérez 1Arpad Rimmel 1Olivier Teytaud
1, 2
JFPDA (2008)
Résumé : Nous ajoutons différentes astuces d'expertise Go dans un programmation de planification Monte-Carlo à partir de bandits, via des simulations virtuelles ajoutées aux statistiques de bandits.
- 1 : TAO (INRIA Saclay - Ile de France)
- INRIA – CNRS : UMR8623 – Université Paris XI - Paris Sud
- 2 : Laboratoire de Recherche en Informatique (LRI)
- CNRS : UMR8623 – Université Paris XI - Paris Sud
- Collaboration : Grid'5000
- Domaine : Mathématiques/Optimisation et contrôle
- inria-00287883, version 1
- http://hal.inria.fr/inria-00287883
- oai:hal.inria.fr:inria-00287883
- Contributeur : Olivier Teytaud
- Soumis le : Vendredi 13 Juin 2008, 11:31:49
- Dernière modification le : Lundi 23 Avril 2012, 16:36:18






Documents associés
Exporter