16 résultats  enregistrer la recherche


...
tel-01400208v1  HDR
Bruno ScherrerContributions algorithmiques au contrôle optimal stochastique à temps discret et horizon infini
Optimisation et contrôle [math.OC]. Université de Lorraine (Nancy), 2016
...
hal-00921261v1  Communication dans un congrès
Bruno ScherrerImproved and Generalized Upper Bounds on the Complexity of Policy Iteration
Neural Information Processing Systems (NIPS) 2013, Dec 2013, South Lake Tahoe, United States. 2013
...
hal-00921287v1  Communication dans un congrès
Bruno ScherrerQuelques majorants de la complexité d'itérations sur les politiques
JFPDA - 8èmes Journées Francophones sur la Planification, la Décision et l'Apprentissage pour la conduite de systèmes - 2013, Jul 2013, Lille, France. 2013
hal-00921291v1  Communication dans un congrès
Bruno ScherrerBoris LesnerSur l'utilisation de politiques non-stationnaires pour les processus de décision Markoviens à horizon infini
JFPDA - 8èmes Journées Francophones sur la Planification, la Décision et l'Apprentissage pour la conduite de systèmes - 2013, Jul 2013, Lille, France. 2013
hal-00922142v1  Article dans une revue
Alain DutechBruno ScherrerChristophe ThieryLa carotte et le bâton... et Tetris
Images des Mathématiques, CNRS, 2013
...
hal-00990508v1  Communication dans un congrès
Manel TagortiBruno ScherrerVitesse de convergence et borne d'erreur pour l'algorithme LSTD($\lambda$)
JFPDA - 9èmes Journées Francophones sur la Planification, la Décision et l'Apprentissage pour la conduite de systèmes, May 2014, Liège, Belgique. 2014
...
hal-01186664v1  Communication dans un congrès
Boris LesnerBruno ScherrerNon-Stationary Approximate Modified Policy Iteration
ICML 2015, Jul 2015, Lille, France. 2015
...
hal-01186667v1  Communication dans un congrès
Manel TagortiBruno ScherrerOn the Rate of Convergence and Error Bounds for LSTD(λ)
ICML 2015, Jul 2015, Lille, France. 2015
...
hal-00759102v2  Article dans une revue
Bruno ScherrerPerformance Bounds for Lambda Policy Iteration and Application to the Game of Tetris
Journal of Machine Learning Research, Journal of Machine Learning Research, 2013, 14, pp.1175-1221
...
hal-00921275v1  Article dans une revue
Matthieu GeistBruno ScherrerOff-policy Learning with Eligibility Traces: A Survey
Journal of Machine Learning Research, Journal of Machine Learning Research, 2014, 15 (1), pp.289-333
...
hal-01091341v1  Article dans une revue
Bruno ScherrerMohammad GhavamzadehVictor GabillonBoris LesnerMatthieu GeistApproximate Modified Policy Iteration and its Application to the Game of Tetris
Journal of Machine Learning Research, Journal of Machine Learning Research, 2015, 16, pp.1629−1676
...
hal-01393328v1  Communication dans un congrès
Julien PérolatBilal PiotMatthieu GeistBruno ScherrerOlivier PietquinSoftened Approximate Policy Iteration for Markov Games
ICML 2016 - 33rd International Conference on Machine Learning, Jun 2016, New York City, United States
...
hal-00921250v1  Communication dans un congrès
Victor GabillonMohammad GhavamzadehBruno ScherrerApproximate Dynamic Programming Finally Performs Well in the Game of Tetris
Neural Information Processing Systems (NIPS) 2013, Dec 2013, South Lake Tahoe, United States. 2013