Skip to Main content Skip to Navigation
Conference papers

Aggregation of Multi-Armed Bandits Learning Algorithms for Opportunistic Spectrum Access

Résumé : Des algorithmes de bandits multi-bras ont récemment été étudiés et évalués pour la radio cognitive (CR), en particulier dans le contexte de l'accès opportuniste au spectre (OSA). Plusieurs solutions ont été explorées sur la base de différents modèles, mais il est difficile de prédire exactement lesquelles pourraient être les meilleures pour des conditions réelles à chaque instant. Par conséquent, les algorithmes d'agrégation experts peuvent être utiles pour sélectionner au cours de l'exécution le meilleur algorithme pour une situation spécifique. Les algorithmes d'agrégation, comme Exp4 datant de 2002, n'ont jamais été utilisés pour l'apprentissage de l'OSA, et nous montrons qu'ils semblent empiriquement sous-efficaces lorsqu'ils sont appliqués à des problèmes stochastiques simples. Dans cet article, nous présentons une variante améliorée, appelée Aggregator. Pour les problèmes d'AOS synthétiques modélisés sous forme de problèmes de Bandit Multi-Armed Bandit (MAB), les résultats de simulation sont présentés pour démontrer son efficacité empirique. Nous combinons des algorithmes classiques, tels que l'échantillonnage Thompson, les algorithmes Upper-Confidence Bounds (UCB et variantes) et Bayesian ou Kullback-Leibler UCB. Notre algorithme offre de bonnes performances par rapport aux algorithmes de pointe (Exp4, CORRAL ou LearnExp), et apparaît comme une approche robuste pour sélectionner en cours d'exécution le meilleur algorithme pour n'importe quel problème stochastique MAB, étant plus réaliste aux paramètres radio du monde réel que n'importe quelle approche basée sur le paramétrage manuel.
Complete list of metadatas

Cited literature [19 references]  Display  Hide  Download

https://hal.inria.fr/hal-01705292
Contributor : Lilian Besson <>
Submitted on : Friday, February 9, 2018 - 11:51:18 AM
Last modification on : Friday, July 10, 2020 - 4:14:28 PM
Document(s) archivé(s) le : Friday, May 4, 2018 - 3:45:44 AM

File

IEEE_WCNC__2018__Paper__Lilian...
Files produced by the author(s)

Licence


Distributed under a Creative Commons Attribution - NonCommercial - ShareAlike 4.0 International License

Identifiers

Citation

Lilian Besson, Emilie Kaufmann, Christophe Moy. Aggregation of Multi-Armed Bandits Learning Algorithms for Opportunistic Spectrum Access. IEEE WCNC - IEEE Wireless Communications and Networking Conference, Apr 2018, Barcelona, Spain. ⟨10.1109/wcnc.2018.8377070⟩. ⟨hal-01705292⟩

Share

Metrics

Record views

1669

Files downloads

863