|
|
|
|---|---|---|
|
inria-00100215v1
Rapport
Daniel Szer, François Charpillet. Coordination through Mutual Notification in Cooperative Multiagent Reinforcement Learning [Intern report] A04-R-051 || szer04a, 2004, 8 p |
||
|
inria-00100255v1
Communication dans un congrès
Daniel Szer, François Charpillet. Coordination through Mutual Notification in Cooperative Multiagent Reinforcement Learning Autonomous Agents and Multi Agent Systems - AAMAS'04, 2004, New York, USA, 2 p, 2004 |
||
|
inria-00100256v1
Communication dans un congrès
Daniel Szer, François Charpillet. Communication et apprentissage par renforcement pour une équipe d'agents Journées Francophones sur les Systèmes Mutli-Agents - JFSMA'04, 2004, Paris, France, 2004 |
||
|
inria-00100214v1
Rapport
Romaric Charton, Anne Boyer, François Charpillet. Apprentissage de stratégies de coordination dans les hSMA [Interne] A04-R-043 || charton04a, 2004, 25 p |
||
|
inria-00100165v1
Communication dans un congrès
Daniel Szer, François Charpillet. Improving Coordination with Communication in Multiagent Reinforcement Learning 16th IEEE International Conference on Tools with Artificial Intelligence - ICTAI'04, 2004, Boca Raton, USA, 5 p, 2004 |
||
|
inria-00099817v1
Communication dans un congrès
Olivier Buffet, Alain Dutech, François Charpillet. Automatic Generation of an Agent's Basic Behaviors Rosenschein, Sandholm, Wooldridge and Yokoo. Second International Joint Conference on Autonomous Agents and Multi-Agent Systems - AAMAS'03, 2003, Melbourne, Victoria, Australie, ACM press, pp.875-882, 2003 |
||
|
inria-00099828v1
Communication dans un congrès
Olivier Buffet, Alain Dutech. A Self-Made Agent Based on Action-Selection Sixth European Workshop on Reinforcement Learning - EWRL-6 2003, 2003, Nancy, France, pp.47-48, 2003 |
||
|
inria-00107659v1
Communication dans un congrès
Rémi Coulom. A Model-Based Actor-Critic Algorithm in Continuous Time and Space Sixth European Workshop on Reinforcement Learning - EWRL6, Sep 2003, Nancy, France, 2 p, 2003 |
||
|
inria-00099829v1
Communication dans un congrès
Alain Dutech, Olivier Buffet. Proceedings of the Sixth European Workshop on Reinforcement Learning Sixth European Workshop on Reinforcement Learning - EWRL-6, 2003, Nancy, France, INRIA, 50 p, 2003 |
||
|
inria-00099773v1
Rapport
Olivier Buffet, Alain Dutech, François Charpillet. Etude de différentes combinaisons de comportements adaptatives au sein d'un agent. [Interne] A03-R-342 || buffet03d, 2003, 40 p |
||
|
inria-00099688v1
Communication dans un congrès
Daniel Szer. Définition autonome de sous-problèmes dans l'apprentissage par renforcement Troisièmes Journées Nationales sur Processus Décisionnel de Markov et Intelligence Artificielle - PDMIA'03, 2003, Caen, France, 9 p, 2003 |
||
|
inria-00099378v1
Communication dans un congrès
Alain Dutech. Solving POMDPs using selected past events European Conference on Artificial Intelligence, 2000, Berlin, Germany, 2000 |
||
|
inria-00099583v1
Communication dans un congrès
Vincent Thomas. Apprentissage collectif par renforcement d'inspiration biologique ? Le système hamelin Troisièmes Journées Nationales sur Processus Décisionnel de Markov et Intelligence Artificielle - PDM et IA 2003, 2003, Caen, France, 7 p, 2003 |
||
|
inria-00099588v1
Communication dans un congrès
Romaric Charton, Anne Boyer, François Charpillet. Learning of Mediation Strategies for Heterogeneous Agents Cooperation Bob Werner. 15th IEEE International Conference on Tools with Artificial Intelligence - ICTAI'2003, 2003, Sacramento, Californie, USA, IEEE Computer Society, pp.330-337, 2003 |
||
|
inria-00099191v1
Rapport
Pierre Adamy. Caractérisation de documents hétérogènes [Stage] A00-R-311 || adamy00a, 2000 |
||
|
tel-00933937v1
Thèse
Florian Pinault. Apprentissage par renforcement pour la généralisation des approches automatiques dans la conception des systèmes de dialogue oral Autre [cs.OH]. Université d'Avignon, 2011. Français. <NNT : 2011AVIG0188> |
||
|
tel-00990245v1
Thèse
Djalel Benbouzid. Sequential prediction for budgeted learning : Application to trigger design Other [cs.OH]. Université Paris Sud - Paris XI, 2014. English. <NNT : 2014PA112031> |
||
|
tel-01485852v1
Thèse
Jithin Kazhuthuveettil Sreedharan. Sampling and inference in complex networks Other [cs.OH]. Université Côte d'Azur, 2016. English. < NNT : 2016AZUR4121 > |
||
|
inria-00100539v1
Communication dans un congrès
Alain Dutech, Bruno Scherrer. Learning to use contextual information for solving POMDP European Workshop on Reinforcement Learning - EWRL-5, Oct 2001, Utrecht, The Netherlands, 2 p, 2001 |
||
|
inria-00100537v1
Communication dans un congrès
Olivier Buffet, Alain Dutech. Looking for Scalable Agents European Workshop On Reinforcement Learning, 2001, Utrecht, The Netherlands, 2 p, 2001 |
||
|
inria-00101090v1
Communication dans un congrès
Alain Dutech, Olivier Buffet, François Charpillet. Multi-Agent Systems by Incremental Gradient Reinforcement Learning. 17th International Joint Conference on Artificial Intelligence, 2001, Seattle, WA, USA, 2, pp.833--838, 2001 |
||
|
inria-00100735v1
Communication dans un congrès
Bruno Scherrer. A connectionist architecture that adpats its representation to complex tasks International Joint Conference on Neural Networks - IJCNN 2002, 2002, Hilton hawaiian Village, Honolulu, HI, 6 p, 2002 |
||
|
inria-00100766v1
Communication dans un congrès
Olivier Buffet, Alain Dutech, François Charpillet. Adaptive Combination of Behaviors in an Agent European Conference on Artificial Intelligence - ECAI'02, 2002, Lyon, France, pp.48-52, 2002 |
||
|
inria-00100787v1
Rapport
Olivier Buffet. Apprentissage par Renforcement pour la Conception de Systèmes Multi-Agents [Interne] A02-R-108 || buffet02c, 2002, 29 p |
||
|
inria-00100765v1
Communication dans un congrès
Olivier Buffet, Alain Dutech, François Charpillet. Learning to weigh basic behaviors in Scalable Agents First International Joint Conference on Autonomous Agents and Multiagent Systems - AAMAS 2002, 2002, Bologna, Italy, 3, pp.1264-1265, 2002 |
||
|
inria-00100814v1
Communication dans un congrès
Bruno Scherrer, François Charpillet. Cooperative Co-learning: A Model-based Approach for Solving Multi Agent Reinforcement Problems 14th IEEE International Conference on Tools with Artificial Intelligence - ICTAI 2002, 2002, Washington, USA, IEEE, 6 p, 2002 |
||
|
tel-00497656v1
Thèse
Sofia Zaidenberg. Apprentissage par renforcement de modeles de contexte pour l'informatique ambiante Autre [cs.OH]. Institut National Polytechnique de Grenoble - INPG, 2009. Français |
||
|
tel-00632968v1
Thèse
Olga Kozlova. Hierarchical & Factored Reinforcement Learning Other [cs.OH]. Université Pierre et Marie Curie - Paris VI, 2010. English |
||
|
inria-00099539v1
Rapport
Raghav Aras. Decentralized control in the pursuit domain [Intership report] A03-R-171 || aras03a, 2003, 59 p |
||
|
inria-00099538v1
Communication dans un congrès
Iadine Chadès, François Charpillet. Modèle de conception de SMA coopératifs par planification réactive Secondes Journées Francophones Modèles Formels de l'Interaction - MFI'2003, 2003, Lille, France, 2003 |
||
|
|
|