77 résultats  enregistrer la recherche


...
tel-01400208v1  HDR
Bruno ScherrerContributions algorithmiques au contrôle optimal stochastique à temps discret et horizon infini
Optimisation et contrôle [math.OC]. Université de Lorraine (Nancy), 2016
inria-00100166v1  Article dans une revue
Bruno ScherrerApproche connexionniste du contrôle optimal
JEDAI - Journal électronique d'intelligence artificielle, AFIA, 2004, 4, 10 p
hal-00644874v1  Communication dans un congrès
Bruno ScherrerMatthieu GeistMoindres carrés récursifs pour l'évaluation off-policy d'une politique avec traces d'éligibilité
6ème Journées Francophones de Planification, Décision et Apprentissage pour la conduite de systèmes - JFPDA 2011, Jun 2011, Rouen, France. 2011
inria-00099717v1  Communication dans un congrès
Bruno ScherrerModular self-organization for a long-living autonomous agent
Eighteenth International Joint Conference on Artificial Intelligence - IJCAI'03, Aug 2003, Acapulco, Mexico, 2003
inria-00099718v1  Communication dans un congrès
Bruno ScherrerParallel asynchronous distributed computations of optimal control in large state space Markov Decision Processes
11th European Symposium on Artificial Neural Networks - ESANN'03, Apr 2003, Bruges, Belgique, 6 p, 2003
...
inria-00098315v1  Rapport
Bruno ScherrerModular self-organization
[Research Report] 2003, pp.16
...
inria-00337652v1  Communication dans un congrès
Marek PetrikBruno ScherrerBiasing Approximate Dynamic Programming with a Lower Discount Factor
Twenty-Second Annual Conference on Neural Information Processing Systems -NIPS 2008, Dec 2008, Vancouver, Canada. 2008
...
inria-00337628v1  Communication dans un congrès
Cesar Torres-HuitzilBernard GirauAmine BoumazaBruno ScherrerEmbedded harmonic control for trajectory planning in large environments
International Conference on ReConFigurable Computing and FPGAs - ReConFig 08, Dec 2008, Cancun, Mexico. 2008
...
inria-00337634v1  Chapitre d'ouvrage
Bernard GirauAmine BoumazaBruno ScherrerCesar Torres-HuitzilBlock-synchronous harmonic control for scalable trajectory planning
Aleksandar Lazinica. Robotics, Automation and Control, I-Tech Publications, pp.85-110, 2008
...
inria-00337659v1  Communication dans un congrès
Bruno ScherrerShie MannorError Reducing Sampling in Reinforcement Learning
NIPS-08 Workshop on Model Uncertainty and Risk in Reinforcement Learning, Dec 2008, Whistler, Canada. 2008
...
hal-01086345v1  Communication dans un congrès
Bruno ScherrerMatthieu GeistLocal Policy Search in a Convex Space and Conservative Policy Iteration as Boosted Policy Search
ECMLPKDD 2014, Sep 2014, Nancy, France. Proceedings of the European Conference on Machine Learning and Principles and Practice of Knowledge Discovery in Databases, 8726, pp.35 - 50, 2014, Lecture Notes in Computer Science. <10.1007/978-3-662-44845-8_3>
...
inria-00537403v1  Communication dans un congrès
Bruno ScherrerShould one compute the Temporal Difference fix point or minimize the Bellman Residual? The unified oblique projection view
27th International Conference on Machine Learning - ICML 2010, Jun 2010, Haïfa, Israel. 2010
inria-00100736v1  Communication dans un congrès
Bruno ScherrerFrançois CharpilletCoevolutive Planning In Markov Decision Processes
First International Joint Conference on Autonomous Agents and Multiagent Systems - AAMAS 2002, 2002, Palazzo Re Enzo, Bologna, Italy, 2 p, 2002
inria-00100735v1  Communication dans un congrès
Bruno ScherrerA connectionist architecture that adpats its representation to complex tasks
International Joint Conference on Neural Networks - IJCNN 2002, 2002, Hilton hawaiian Village, Honolulu, HI, 6 p, 2002
inria-00100814v1  Communication dans un congrès
Bruno ScherrerFrançois CharpilletCooperative Co-learning: A Model-based Approach for Solving Multi Agent Reinforcement Problems
14th IEEE International Conference on Tools with Artificial Intelligence - ICTAI 2002, 2002, Washington, USA, IEEE, 6 p, 2002
...
hal-00907295v1  Communication dans un congrès
Manel TagortiBruno ScherrerOlivier BuffetJoerg HoffmannAbstraction Pathologies In Markov Decision Processes
8èmes Journées Francophones sur la Planification, la Décision et l'Apprentissage pour la conduite de systèmes, Jul 2013, Lille, France. 2013, Actes des 8èmes Journées Francophones sur la Planification, la Décision et l'Apprentissage pour la conduite de systèmes
...
hal-00907315v1  Communication dans un congrès
Manel TagortiBruno ScherrerOlivier BuffetJoerg HoffmannAbstraction Pathologies In Markov Decision Processes
ICAPS'13 workshop on Heuristics and Search for Domain-independent Planning (HSDIP), Jun 2013, Rome, Italy. 2013
...
hal-00921261v1  Communication dans un congrès
Bruno ScherrerImproved and Generalized Upper Bounds on the Complexity of Policy Iteration
Neural Information Processing Systems (NIPS) 2013, Dec 2013, South Lake Tahoe, United States. 2013
...
hal-00921287v1  Communication dans un congrès
Bruno ScherrerQuelques majorants de la complexité d'itérations sur les politiques
JFPDA - 8èmes Journées Francophones sur la Planification, la Décision et l'Apprentissage pour la conduite de systèmes - 2013, Jul 2013, Lille, France. 2013
hal-00921291v1  Communication dans un congrès
Bruno ScherrerBoris LesnerSur l'utilisation de politiques non-stationnaires pour les processus de décision Markoviens à horizon infini
JFPDA - 8èmes Journées Francophones sur la Planification, la Décision et l'Apprentissage pour la conduite de systèmes - 2013, Jul 2013, Lille, France. 2013
hal-00922142v1  Article dans une revue
Alain DutechBruno ScherrerChristophe ThieryLa carotte et le bâton... et Tetris
Images des Mathématiques, CNRS, 2013
...
hal-00989982v1  Communication dans un congrès
Bruno ScherrerApproximate Policy Iteration Schemes: A Comparison
ICML - 31st International Conference on Machine Learning - 2014, Jun 2014, Pékin, China. 2014
...
hal-00990508v1  Communication dans un congrès
Manel TagortiBruno ScherrerVitesse de convergence et borne d'erreur pour l'algorithme LSTD($\lambda$)
JFPDA - 9èmes Journées Francophones sur la Planification, la Décision et l'Apprentissage pour la conduite de systèmes, May 2014, Liège, Belgique. 2014