22055 articles – 15889 Notices  [english version]

hal-00595695, version 3

Robust approachability and regret minimization in games with partial monitoring

Shie Mannor () 1, Vianney Perchet () 2, Gilles Stoltz () 345

(23/01/2012)

Résumé : Approachability has become a standard tool in analyzing earning algorithms in the adversarial online learning setup. We develop a variant of approachability for games where there is ambiguity in the obtained reward that belongs to a set, rather than being a single vector. Using this variant we tackle the problem of approachability in games with partial monitoring and develop simple and efficient algorithms (i.e., with constant per-step complexity) for this setup. We finally consider external regret and internal regret in repeated games with partial monitoring and derive regret-minimizing strategies based on approachability theory.

  • 1 :  Department of Electrical Engineering - Technion (EE-Technion)
  • Israel Institute of Technology
  • 2 :  Centre de Mathématiques et de Leurs Applications (CMLA)
  • CNRS : UMR8536 – École normale supérieure de Cachan - ENS Cachan
  • 3 :  Département de Mathématiques et Applications (DMA)
  • CNRS : UMR8553 – Ecole normale supérieure de Paris - ENS Paris
  • 4 :  Groupement de Recherche et d'Etudes en Gestion à HEC (GREGH)
  • GROUPE HEC – CNRS : UMR2959
  • 5 :  CLASSIC (INRIA Paris - Rocquencourt)
  • Ecole normale supérieure de Paris - ENS Paris – INRIA
 
  • hal-00595695, version 3
  • oai:hal.archives-ouvertes.fr:hal-00595695
  • Contributeur : 
  • Soumis le : Mercredi 15 Février 2012, 15:19:50
  • Dernière modification le : Mercredi 15 Février 2012, 15:38:49