OpenDP a free Reinforcement Learning toolbox for discrete time control problems

Sylvain Gelly 1 Olivier Teytaud 1
1 TANC - Algorithmic number theory for cryptology
LIX - Laboratoire d'informatique de l'École polytechnique [Palaiseau], Inria Saclay - Ile de France, Polytechnique - X, CNRS - Centre National de la Recherche Scientifique : UMR7161
Abstract : OpenDP (http://opendp.sourceforge.net) is a free software (under GPL) written in C++ for control problems: (i) with discrete time steps (either finite horizon, or approximation of infinite horizon by temporal-ring for stationnary problems), (ii) where the transition function newState = T (state, decision) can be encoded in C++, (iii) possibly stochastic (with the function T above depending on some random process).
Type de document :
Communication dans un congrès
NIPS Workshop on Machine Learning Open Source Software, Dec 2006, Whistler (B.C.), 2006
Liste complète des métadonnées

https://hal.inria.fr/inria-00117392
Contributeur : Sylvain Gelly <>
Soumis le : vendredi 1 décembre 2006 - 14:33:29
Dernière modification le : jeudi 11 janvier 2018 - 06:22:14
Document(s) archivé(s) le : jeudi 20 septembre 2012 - 15:25:58

Fichier

openDP_NIPS.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : inria-00117392, version 1

Collections

Citation

Sylvain Gelly, Olivier Teytaud. OpenDP a free Reinforcement Learning toolbox for discrete time control problems. NIPS Workshop on Machine Learning Open Source Software, Dec 2006, Whistler (B.C.), 2006. 〈inria-00117392〉

Partager

Métriques

Consultations de la notice

355

Téléchargements de fichiers

96