https://hal.inria.fr/inria-00439128
Contributeur : Olivier Buffet
<>
Soumis le : dimanche 6 décembre 2009 - 11:30:34
Dernière modification le : jeudi 11 janvier 2018 - 06:19:51
Olivier Buffet. Policy-Gradient Algorithms. Olivier Sigaud and Olivier Buffet. Markov Decision Processes in Artificial Intelligence, ISTE Ltd and John Wiley & Sons Inc, 2010, 1848211678. 〈inria-00439128〉