Skip to Main content Skip to Navigation
Preprints, Working Papers, ...

The Generalized Likelihood Ratio Test meets klUCB: an Improved Algorithm for Piece-Wise Non-Stationary Bandits

Résumé : Nous proposons un nouvel algorithme pour le problème du bandit non stationnaire i.i.d. avec des récompenses bornées. Notre proposition, GLR-klUCB, combine un algorithme de bandit efficace, klUCB, avec un détecteur de points de changement efficace et sans paramètre, le test du rapport de vraisemblance généralisé, dans sa variante de Bernoulli. Nous fournissons de nouvelles garanties théoriques d'intérêt indépendant pour ce test (GLRT). Nous analysons deux variantes de notre stratégie, basées sur les redémarrages locaux et les redémarrages globaux, et montrons que leur regret est limité par $O(\Upsilon_T \sqrt{T \log(T)})$ si le nombre de points de changement $Υ_T$ est inconnu, et par $O(\sqrt{\Upsilon_T T \log(T)})$ si $\Upsilon_T$ est connu. Ces résultats améliorent les bornes de l'état de l'art actuel, car notre algorithme ne nécessite aucun réglage basé sur la connaissance de la complexité du problème autre que $Υ_T$. Nous présentons des expériences numériques montrant que GLR-klUCB surpasse les algorithmes passivement et activement adaptatifs de la littérature, et soulignons les avantages de l'utilisation de redémarrages locaux.
Complete list of metadatas

https://hal.inria.fr/hal-02006471
Contributor : Lilian Besson <>
Submitted on : Monday, February 4, 2019 - 4:08:13 PM
Last modification on : Monday, May 18, 2020 - 1:58:59 PM
Document(s) archivé(s) le : Sunday, May 5, 2019 - 4:41:23 PM

Files

The-Generalized-Likelihood-Rat...
Files produced by the author(s)

Licence


Distributed under a Creative Commons Attribution - NonCommercial - ShareAlike 4.0 International License

Identifiers

  • HAL Id : hal-02006471, version 1
  • ARXIV : 1902.01575

Citation

Lilian Besson, Emilie Kaufmann. The Generalized Likelihood Ratio Test meets klUCB: an Improved Algorithm for Piece-Wise Non-Stationary Bandits. 2019. ⟨hal-02006471⟩

Share

Metrics

Record views

289

Files downloads

485