Upper Confidence Trees with Short Term Partial Information

Olivier Teytaud 1, 2 Sébastien Flory 3
2 TAO - Machine Learning and Optimisation
LRI - Laboratoire de Recherche en Informatique, UP11 - Université Paris-Sud - Paris 11, Inria Saclay - Ile de France, CNRS - Centre National de la Recherche Scientifique : UMR8623
Abstract : We show some mathematical links between partially observable (PO) games in which information is regu larly revealed, and simultaneous actions games. Using this, we study the extension of Monte-Carlo Tr ee Search algorithms to PO games and to games with simultaneous actions. We apply the results to Urb an Rivals, a free PO internet card game with more than 10 millions of registered users.
Type de document :
Communication dans un congrès
EvoGames 2011, Apr 2011, Turino, Italy. Springer, 6624, pp.153-162, 2011, Lecture Notes in Computer Science. 〈10.1007/978-3-642-20525-5〉
Liste complète des métadonnées

Littérature citée [13 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/inria-00585475
Contributeur : Olivier Teytaud <>
Soumis le : mardi 26 février 2013 - 12:39:45
Dernière modification le : jeudi 5 avril 2018 - 12:30:12
Document(s) archivé(s) le : lundi 27 mai 2013 - 06:40:11

Fichier

samcts.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

Collections

Citation

Olivier Teytaud, Sébastien Flory. Upper Confidence Trees with Short Term Partial Information. EvoGames 2011, Apr 2011, Turino, Italy. Springer, 6624, pp.153-162, 2011, Lecture Notes in Computer Science. 〈10.1007/978-3-642-20525-5〉. 〈inria-00585475v2〉

Partager

Métriques

Consultations de la notice

309

Téléchargements de fichiers

298