|
|
||
|---|---|---|
|
tel-01400208v1
HDR
Bruno Scherrer. Contributions algorithmiques au contrôle optimal stochastique à temps discret et horizon infini Optimisation et contrôle [math.OC]. Université de Lorraine (Nancy), 2016 |
||
|
inria-00100166v1
Article dans une revue
Bruno Scherrer. Approche connexionniste du contrôle optimal JEDAI - Journal électronique d'intelligence artificielle, AFIA, 2004, 4, 10 p |
||
|
inria-00480952v1
Rapport
Bruno Scherrer, Christophe Thiery. Performance bound for Approximate Optimistic Policy Iteration [Technical Report] 2010 |
||
|
inria-00263536v1
Pré-publication, Document de travail
Amine Boumaza, Bruno Scherrer. Convergence and rate of convergence of simple ant models 2007 |
||
|
hal-00644874v1
Communication dans un congrès
Bruno Scherrer, Matthieu Geist. Moindres carrés récursifs pour l'évaluation off-policy d'une politique avec traces d'éligibilité 6ème Journées Francophones de Planification, Décision et Apprentissage pour la conduite de systèmes - JFPDA 2011, Jun 2011, Rouen, France. 2011 |
||
|
inria-00099717v1
Communication dans un congrès
Bruno Scherrer. Modular self-organization for a long-living autonomous agent Eighteenth International Joint Conference on Artificial Intelligence - IJCAI'03, Aug 2003, Acapulco, Mexico, 2003 |
||
|
inria-00099718v1
Communication dans un congrès
Bruno Scherrer. Parallel asynchronous distributed computations of optimal control in large state space Markov Decision Processes 11th European Symposium on Artificial Neural Networks - ESANN'03, Apr 2003, Bruges, Belgique, 6 p, 2003 |
||
|
inria-00098352v1
Rapport
Bruno Scherrer, Shie Mannor. Error reducing sampling in reinforcement learning [Research Report] 2004, pp.15 |
||
|
inria-00337652v1
Communication dans un congrès
Marek Petrik, Bruno Scherrer. Biasing Approximate Dynamic Programming with a Lower Discount Factor Twenty-Second Annual Conference on Neural Information Processing Systems -NIPS 2008, Dec 2008, Vancouver, Canada. 2008 |
||
|
inria-00337628v1
Communication dans un congrès
Cesar Torres-Huitzil, Bernard Girau, Amine Boumaza, Bruno Scherrer. Embedded harmonic control for trajectory planning in large environments International Conference on ReConFigurable Computing and FPGAs - ReConFig 08, Dec 2008, Cancun, Mexico. 2008 |
||
|
inria-00337634v1
Chapitre d'ouvrage
Bernard Girau, Amine Boumaza, Bruno Scherrer, Cesar Torres-Huitzil. Block-synchronous harmonic control for scalable trajectory planning Aleksandar Lazinica. Robotics, Automation and Control, I-Tech Publications, pp.85-110, 2008 |
||
|
inria-00337659v1
Communication dans un congrès
Bruno Scherrer, Shie Mannor. Error Reducing Sampling in Reinforcement Learning NIPS-08 Workshop on Model Uncertainty and Risk in Reinforcement Learning, Dec 2008, Whistler, Canada. 2008 |
||
|
hal-01086345v1
Communication dans un congrès
Bruno Scherrer, Matthieu Geist. Local Policy Search in a Convex Space and Conservative Policy Iteration as Boosted Policy Search ECMLPKDD 2014, Sep 2014, Nancy, France. Proceedings of the European Conference on Machine Learning and Principles and Practice of Knowledge Discovery in Databases, 8726, pp.35 - 50, 2014, Lecture Notes in Computer Science. <10.1007/978-3-662-44845-8_3> |
||
|
inria-00537403v1
Communication dans un congrès
Bruno Scherrer. Should one compute the Temporal Difference fix point or minimize the Bellman Residual? The unified oblique projection view 27th International Conference on Machine Learning - ICML 2010, Jun 2010, Haïfa, Israel. 2010 |
||
|
inria-00100736v1
Communication dans un congrès
Bruno Scherrer, François Charpillet. Coevolutive Planning In Markov Decision Processes First International Joint Conference on Autonomous Agents and Multiagent Systems - AAMAS 2002, 2002, Palazzo Re Enzo, Bologna, Italy, 2 p, 2002 |
||
|
inria-00100735v1
Communication dans un congrès
Bruno Scherrer. A connectionist architecture that adpats its representation to complex tasks International Joint Conference on Neural Networks - IJCNN 2002, 2002, Hilton hawaiian Village, Honolulu, HI, 6 p, 2002 |
||
|
inria-00100814v1
Communication dans un congrès
Bruno Scherrer, François Charpillet. Cooperative Co-learning: A Model-based Approach for Solving Multi Agent Reinforcement Problems 14th IEEE International Conference on Tools with Artificial Intelligence - ICTAI 2002, 2002, Washington, USA, IEEE, 6 p, 2002 |
||
|
hal-00907295v1
Communication dans un congrès
Manel Tagorti, Bruno Scherrer, Olivier Buffet, Joerg Hoffmann. Abstraction Pathologies In Markov Decision Processes 8èmes Journées Francophones sur la Planification, la Décision et l'Apprentissage pour la conduite de systèmes, Jul 2013, Lille, France. 2013, Actes des 8èmes Journées Francophones sur la Planification, la Décision et l'Apprentissage pour la conduite de systèmes |
||
|
hal-00907315v1
Communication dans un congrès
Manel Tagorti, Bruno Scherrer, Olivier Buffet, Joerg Hoffmann. Abstraction Pathologies In Markov Decision Processes ICAPS'13 workshop on Heuristics and Search for Domain-independent Planning (HSDIP), Jun 2013, Rome, Italy. 2013 |
||
|
hal-00644516v2
Rapport
Matthieu Geist, Bruno Scherrer. Off-policy Learning with Eligibility Traces: A Survey [Research Report] 2013, pp.43 |
||
|
hal-00815996v1
Pré-publication, Document de travail
Boris Lesner, Bruno Scherrer. Tight Performance Bounds for Approximate Modified Policy Iteration with Non-Stationary Policies 2013 |
||
|
hal-00921261v1
Communication dans un congrès
Bruno Scherrer. Improved and Generalized Upper Bounds on the Complexity of Policy Iteration Neural Information Processing Systems (NIPS) 2013, Dec 2013, South Lake Tahoe, United States. 2013 |
||
|
hal-00921287v1
Communication dans un congrès
Bruno Scherrer. Quelques majorants de la complexité d'itérations sur les politiques JFPDA - 8èmes Journées Francophones sur la Planification, la Décision et l'Apprentissage pour la conduite de systèmes - 2013, Jul 2013, Lille, France. 2013 |
||
|
hal-00921291v1
Communication dans un congrès
Bruno Scherrer, Boris Lesner. Sur l'utilisation de politiques non-stationnaires pour les processus de décision Markoviens à horizon infini JFPDA - 8èmes Journées Francophones sur la Planification, la Décision et l'Apprentissage pour la conduite de systèmes - 2013, Jul 2013, Lille, France. 2013 |
||
|
hal-00922142v1
Article dans une revue
Alain Dutech, Bruno Scherrer, Christophe Thiery. La carotte et le bâton... et Tetris Images des Mathématiques, CNRS, 2013 |
||
|
hal-00682172v2
Rapport
Bruno Scherrer. On the Use of Non-Stationary Policies for Infinite-Horizon Discounted Markov Decision Processes [Research Report] 2012 |
||
|
hal-00989982v1
Communication dans un congrès
Bruno Scherrer. Approximate Policy Iteration Schemes: A Comparison ICML - 31st International Conference on Machine Learning - 2014, Jun 2014, Pékin, China. 2014 |
||
|
hal-00989991v1
Rapport
Bruno Scherrer. Une étude comparative de quelques schémas d'approximation de type iterations sur les politiques [Rapport de recherche] 2014 |
||
|
hal-00990508v1
Communication dans un congrès
Manel Tagorti, Bruno Scherrer. Vitesse de convergence et borne d'erreur pour l'algorithme LSTD($\lambda$) JFPDA - 9èmes Journées Francophones sur la Planification, la Décision et l'Apprentissage pour la conduite de systèmes, May 2014, Liège, Belgique. 2014 |
||
|
|
||