Optimization of Energy Policies Using Direct Value Search

Jérémie Decock 1, 2 Jean-Joseph Christophe 1, 2 Olivier Teytaud 1, 2
1 TAO - Machine Learning and Optimisation
LRI - Laboratoire de Recherche en Informatique, UP11 - Université Paris-Sud - Paris 11, Inria Saclay - Ile de France, CNRS - Centre National de la Recherche Scientifique : UMR8623
Abstract : Direct Policy Search is a widely used tool for reinforcement learning; however, it is usually not suitable for handling high-dimensional constrained action spaces such as those arising in power system control (unit commitmen problems). We propose Direct Value Search, an hybridization of DPS with Bellman decomposition techniques. We prove runtime properties, and apply the results to an energy management problem.
Type de document :
Documents associés à des manifestations scientifiques -- Hal-inria+
9èmes Journées Francophones de Planification, Décision et Apprentissage (JFPDA'14), May 2014, Liège, Belgium. 2014
Liste complète des métadonnées

https://hal.inria.fr/hal-00997562
Contributeur : Jérémie Decock <>
Soumis le : mercredi 4 juin 2014 - 23:54:07
Dernière modification le : jeudi 9 février 2017 - 15:57:49
Document(s) archivé(s) le : jeudi 4 septembre 2014 - 10:41:33

Fichier

slides.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-00997562, version 1

Citation

Jérémie Decock, Jean-Joseph Christophe, Olivier Teytaud. Optimization of Energy Policies Using Direct Value Search. 9èmes Journées Francophones de Planification, Décision et Apprentissage (JFPDA'14), May 2014, Liège, Belgium. 2014. <hal-00997562>

Partager

Métriques

Consultations de
la notice

246

Téléchargements du document

217