Online Learning in Adversarial Lipschitz Environments

Odalric Maillard 1 Rémi Munos 1
1 SEQUEL - Sequential Learning
LIFL - Laboratoire d'Informatique Fondamentale de Lille, Inria Lille - Nord Europe, LAGIS - Laboratoire d'Automatique, Génie Informatique et Signal
Abstract : We consider the problem of online learning in an adversarial environment when the reward functions chosen by the adversary are assumed to be Lipschitz. This setting extends previous works on linear and convex online learning. We provide a class of algorithms with cumulative regret upper bounded by O(sqrt{dT ln(λ)}) where d is the dimension of the search space, T the time horizon, and λ the Lipschitz constant. Efficient numerical implementations using particle methods are discussed. Applications include online supervised learning problems for both full and partial (bandit) information settings, for a large class of non-linear regressors/classifiers, such as neural networks.
Type de document :
Communication dans un congrès
European Conference on Machine Learing, 2010, Barcelone, Spain. Springer, 2010
Liste complète des métadonnées

Littérature citée [24 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/inria-00510674
Contributeur : Rémi Munos <>
Soumis le : vendredi 20 août 2010 - 11:50:13
Dernière modification le : jeudi 11 janvier 2018 - 06:22:13
Document(s) archivé(s) le : mardi 23 octobre 2012 - 12:32:35

Fichier

ALF_ecml10.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : inria-00510674, version 1

Collections

Citation

Odalric Maillard, Rémi Munos. Online Learning in Adversarial Lipschitz Environments. European Conference on Machine Learing, 2010, Barcelone, Spain. Springer, 2010. 〈inria-00510674〉

Partager

Métriques

Consultations de la notice

300

Téléchargements de fichiers

304