Upper Confidence Trees with Short Term Partial Information

Olivier Teytaud 1, 2 Sébastien Flory 3
2 TAO - Machine Learning and Optimisation
CNRS - Centre National de la Recherche Scientifique : UMR8623, Inria Saclay - Ile de France, UP11 - Université Paris-Sud - Paris 11, LRI - Laboratoire de Recherche en Informatique
Abstract : We show some mathematical links between partially observable (PO) games in which information is regu larly revealed, and simultaneous actions games. Using this, we study the extension of Monte-Carlo Tr ee Search algorithms to PO games and to games with simultaneous actions. We apply the results to Urb an Rivals, a free PO internet card game with more than 10 millions of registered users.
Type de document :
Communication dans un congrès
EvoGames 2011, Apr 2011, Turino, Italy. Springer, 6624, pp.153-162, 2011, Lecture Notes in Computer Science. 〈10.1007/978-3-642-20525-5〉
Liste complète des métadonnées

Littérature citée [13 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/inria-00585475
Contributeur : Olivier Teytaud <>
Soumis le : mardi 26 février 2013 - 12:39:45
Dernière modification le : jeudi 11 janvier 2018 - 06:22:14
Document(s) archivé(s) le : lundi 27 mai 2013 - 06:40:11

Fichier

samcts.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

Citation

Olivier Teytaud, Sébastien Flory. Upper Confidence Trees with Short Term Partial Information. EvoGames 2011, Apr 2011, Turino, Italy. Springer, 6624, pp.153-162, 2011, Lecture Notes in Computer Science. 〈10.1007/978-3-642-20525-5〉. 〈inria-00585475v2〉

Partager

Métriques

Consultations de la notice

226

Téléchargements de fichiers

257