44 résultats  enregistrer la recherche


  • 1
  • 2
inria-00100255v1  Communication dans un congrès
Daniel SzerFrançois CharpilletCoordination through Mutual Notification in Cooperative Multiagent Reinforcement Learning
Autonomous Agents and Multi Agent Systems - AAMAS'04, 2004, New York, USA, 2 p, 2004
inria-00100256v1  Communication dans un congrès
Daniel SzerFrançois CharpilletCommunication et apprentissage par renforcement pour une équipe d'agents
Journées Francophones sur les Systèmes Mutli-Agents - JFSMA'04, 2004, Paris, France, 2004
inria-00100165v1  Communication dans un congrès
Daniel SzerFrançois CharpilletImproving Coordination with Communication in Multiagent Reinforcement Learning
16th IEEE International Conference on Tools with Artificial Intelligence - ICTAI'04, 2004, Boca Raton, USA, 5 p, 2004
inria-00099817v1  Communication dans un congrès
Olivier BuffetAlain DutechFrançois CharpilletAutomatic Generation of an Agent's Basic Behaviors
Rosenschein, Sandholm, Wooldridge and Yokoo. Second International Joint Conference on Autonomous Agents and Multi-Agent Systems - AAMAS'03, 2003, Melbourne, Victoria, Australie, ACM press, pp.875-882, 2003
inria-00099828v1  Communication dans un congrès
Olivier BuffetAlain DutechA Self-Made Agent Based on Action-Selection
Sixth European Workshop on Reinforcement Learning - EWRL-6 2003, 2003, Nancy, France, pp.47-48, 2003
...
inria-00107659v1  Communication dans un congrès
Rémi CoulomA Model-Based Actor-Critic Algorithm in Continuous Time and Space
Sixth European Workshop on Reinforcement Learning - EWRL6, Sep 2003, Nancy, France, 2 p, 2003
inria-00099829v1  Communication dans un congrès
Alain DutechOlivier BuffetProceedings of the Sixth European Workshop on Reinforcement Learning
Sixth European Workshop on Reinforcement Learning - EWRL-6, 2003, Nancy, France, INRIA, 50 p, 2003
inria-00099688v1  Communication dans un congrès
Daniel SzerDéfinition autonome de sous-problèmes dans l'apprentissage par renforcement
Troisièmes Journées Nationales sur Processus Décisionnel de Markov et Intelligence Artificielle - PDMIA'03, 2003, Caen, France, 9 p, 2003
inria-00099378v1  Communication dans un congrès
Alain DutechSolving POMDPs using selected past events
European Conference on Artificial Intelligence, 2000, Berlin, Germany, 2000
inria-00099583v1  Communication dans un congrès
Vincent ThomasApprentissage collectif par renforcement d'inspiration biologique ? Le système hamelin
Troisièmes Journées Nationales sur Processus Décisionnel de Markov et Intelligence Artificielle - PDM et IA 2003, 2003, Caen, France, 7 p, 2003
inria-00099588v1  Communication dans un congrès
Romaric ChartonAnne BoyerFrançois CharpilletLearning of Mediation Strategies for Heterogeneous Agents Cooperation
Bob Werner. 15th IEEE International Conference on Tools with Artificial Intelligence - ICTAI'2003, 2003, Sacramento, Californie, USA, IEEE Computer Society, pp.330-337, 2003
inria-00099191v1  Rapport
Pierre AdamyCaractérisation de documents hétérogènes
[Stage] A00-R-311 || adamy00a, 2000
inria-00100539v1  Communication dans un congrès
Alain DutechBruno ScherrerLearning to use contextual information for solving POMDP
European Workshop on Reinforcement Learning - EWRL-5, Oct 2001, Utrecht, The Netherlands, 2 p, 2001
inria-00100537v1  Communication dans un congrès
Olivier BuffetAlain DutechLooking for Scalable Agents
European Workshop On Reinforcement Learning, 2001, Utrecht, The Netherlands, 2 p, 2001
inria-00101090v1  Communication dans un congrès
Alain DutechOlivier BuffetFrançois CharpilletMulti-Agent Systems by Incremental Gradient Reinforcement Learning.
17th International Joint Conference on Artificial Intelligence, 2001, Seattle, WA, USA, 2, pp.833--838, 2001
inria-00100735v1  Communication dans un congrès
Bruno ScherrerA connectionist architecture that adpats its representation to complex tasks
International Joint Conference on Neural Networks - IJCNN 2002, 2002, Hilton hawaiian Village, Honolulu, HI, 6 p, 2002
inria-00100766v1  Communication dans un congrès
Olivier BuffetAlain DutechFrançois CharpilletAdaptive Combination of Behaviors in an Agent
European Conference on Artificial Intelligence - ECAI'02, 2002, Lyon, France, pp.48-52, 2002
inria-00100765v1  Communication dans un congrès
Olivier BuffetAlain DutechFrançois CharpilletLearning to weigh basic behaviors in Scalable Agents
First International Joint Conference on Autonomous Agents and Multiagent Systems - AAMAS 2002, 2002, Bologna, Italy, 3, pp.1264-1265, 2002
inria-00100814v1  Communication dans un congrès
Bruno ScherrerFrançois CharpilletCooperative Co-learning: A Model-based Approach for Solving Multi Agent Reinforcement Problems
14th IEEE International Conference on Tools with Artificial Intelligence - ICTAI 2002, 2002, Washington, USA, IEEE, 6 p, 2002
...
tel-00497656v1  Thèse
Sofia ZaidenbergApprentissage par renforcement de modeles de contexte pour l'informatique ambiante
Autre [cs.OH]. Institut National Polytechnique de Grenoble - INPG, 2009. Français
...
tel-00632968v1  Thèse
Olga KozlovaHierarchical & Factored Reinforcement Learning
Other [cs.OH]. Université Pierre et Marie Curie - Paris VI, 2010. English
inria-00099539v1  Rapport
Raghav ArasDecentralized control in the pursuit domain
[Intership report] A03-R-171 || aras03a, 2003, 59 p
inria-00099538v1  Communication dans un congrès
Iadine ChadèsFrançois CharpilletModèle de conception de SMA coopératifs par planification réactive
Secondes Journées Francophones Modèles Formels de l'Interaction - MFI'2003, 2003, Lille, France, 2003
  • 1
  • 2