Constant Step Size Stochastic Gradient Descent for Probabilistic Modeling

Dmitry Babichev; Francis Bach

Communication Dans Un Congrès Année : 2018

Constant Step Size Stochastic Gradient Descent for Probabilistic Modeling

(1, 2) , (2, 1)

1
2

Dmitry Babichev

Fonction : Auteur
PersonId : 1039390

Statistical Machine Learning and Parsimony

Laboratoire d'informatique de l'école normale supérieure

Francis Bach

Fonction : Auteur
PersonId : 863086

Laboratoire d'informatique de l'école normale supérieure

Statistical Machine Learning and Parsimony

Résumé

Stochastic gradient methods enable learning probabilistic models from large amounts of data. While large step-sizes (learning rates) have shown to be best for least-squares (e.g., Gaussian noise) once combined with parameter averaging, these are not leading to con-vergent algorithms in general. In this paper , we consider generalized linear models, that is, conditional models based on exponential families. We propose averaging moment parameters instead of natural parameters for constant-step-size stochastic gradient descent. For finite-dimensional models, we show that this can sometimes (and surprisingly) lead to better predictions than the best linear model. For infinite-dimensional models, we show that it always converges to optimal predictions, while averaging natural parameters never does. We illustrate our findings with simulations on synthetic data and classical benchmarks with many observations.

Domaines

Machine Learning [stat.ML] Optimisation et contrôle [math.OC]

Fichier principal

Averaging_predictions.pdf (496.78 Ko)

Origine : Fichiers produits par l'(les) auteur(s)

Dmitry Babichev : Connectez-vous pour contacter le contributeur

https://inria.hal.science/hal-01929810

Soumis le : mercredi 21 novembre 2018-14:14:39

Dernière modification le : samedi 20 avril 2024-03:09:08

Archivage à long terme le : vendredi 22 février 2019-14:12:46

Dates et versions

hal-01929810 , version 1 (21-11-2018)

Identifiants

HAL Id : hal-01929810 , version 1
ARXIV : 1804.05567

Citer

Dmitry Babichev, Francis Bach. Constant Step Size Stochastic Gradient Descent for Probabilistic Modeling. UAI 2018 - Conference on Uncertainty in Artificial Intelligence, Aug 2018, Monterey, United States. ⟨hal-01929810⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

ENS-PARIS CNRS INRIA INRIA2 TDS-MACS PSL

60 Consultations

59 Téléchargements

Constant Step Size Stochastic Gradient Descent for Probabilistic Modeling

Résumé

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Altmetric

Partager