Taylor expansion policy optimization

Yunhao Tang; Michal Valko; Rémi Munos

Communication Dans Un Congrès Année : 2020

Taylor expansion policy optimization

(1, 2) , (2) , (2)

1
2

Yunhao Tang

Fonction : Auteur

Columbia University [New York]

DeepMind [Paris]

Michal Valko

Fonction : Auteur
PersonId : 284
IdHAL : michal
IdRef : 22360934X

DeepMind [Paris]

Rémi Munos

Fonction : Auteur
PersonId : 836863

DeepMind [Paris]

Résumé

In this work, we investigate the application of Taylor expansions in reinforcement learning. In particular, we propose Taylor expansion policy optimization , a policy optimization formalism that generalizes prior work (e.g., TRPO) as a first-order special case. We also show that Taylor expansions intimately relate to off-policy evaluation. Finally, we show that this new formulation entails modifications which improve the performance of several state-of-the-art distributed algorithms.

Domaines

Machine Learning [stat.ML]

Fichier principal

Taylor_expansion_policy_optimization__arxiv_ (3).pdf (765.05 Ko)

Origine : Fichiers produits par l'(les) auteur(s)

Michal Valko : Connectez-vous pour contacter le contributeur

https://inria.hal.science/hal-02509561

Soumis le : lundi 16 mars 2020-21:09:45

Dernière modification le : vendredi 18 décembre 2020-18:46:06

Archivage à long terme le : mercredi 17 juin 2020-15:17:43

Dates et versions

hal-02509561 , version 1 (16-03-2020)

Identifiants

HAL Id : hal-02509561 , version 1

Citer

Yunhao Tang, Michal Valko, Rémi Munos. Taylor expansion policy optimization. International Conference on Machine Learning, 2020, Vienna, Austria. ⟨hal-02509561⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

63 Consultations

125 Téléchargements

Taylor expansion policy optimization

Résumé

Domaines

Dates et versions

Identifiants

Citer

Exporter

Partager