Olivier Buffet. Méthodes de gradient pour la recherche de politiques paramétrées. O. Buffet and O. Sigaud.
Processus décisionnels de Markov en intelligence artificielle, 2 - méthodes avancées et applications, Lavoisier - Hermes Science Publications, pp.81-107, 2008, IC2 - informatique et systèmes d'information, 978-2746220584.
⟨inria-00326872⟩