Apprentissage par renforcement dans un système multi-agents

Olivier Buffet 1
1 MAIA - Autonomous intelligent machine
INRIA Lorraine, LORIA - Laboratoire Lorrain de Recherche en Informatique et ses Applications
Résumé : Longtemps l'Intelligence Artificielle s'est attachée à faire effectuer par un unique agent des tâches plus ou moins complexes. Les méthodes exactes, cherchant par des méthodes systématiques à résoudre un problème, sont hélas souvent inexploitables quand des contraintes de taille mémoire ou de temps-réel entrent en jeu. On se propose alors de trouver plutôt des solutions optimales ou sous-optimales, par des méthodes approchées de planification ou d'apprentissage qui permettent des convergences beaucoup plus rapides (les processus décisionnels de Markov dont il sera sujet en font partie). Mais les capacités d'un unique agent peuvent rester insuffisantes, au moins au niveau de ses moyens matériels. l'idée est que certains problèmes sont résolus non par des individus séparément, mais par des groupes d'individus. Même de simples insectes, du fait de leur organisation, peuvent ainsi effectuer des prouesses. Ce stage de DEA vise à faire une étude des travaux existants dans le domaine de l'apprentissage au sein de systèmes mono- et multi-agents. Le cadre multi-agents pose des problèmes nouveaux aux méthodes d'apprentissage par renforcement connues, les agents devant coordonner leurs actions. Le stage a été en outre l'occasion de mettre en oeuvre des algorithmes classiques sur quelques exemples simples.
Type de document :
Rapport
[Stage] A00-R-321 || buffet00a, 2000, 42 p
Liste complète des métadonnées

https://hal.inria.fr/inria-00099176
Contributeur : Publications Loria <>
Soumis le : mardi 26 septembre 2006 - 08:51:33
Dernière modification le : jeudi 11 janvier 2018 - 06:19:51

Identifiants

  • HAL Id : inria-00099176, version 1

Collections

Citation

Olivier Buffet. Apprentissage par renforcement dans un système multi-agents. [Stage] A00-R-321 || buffet00a, 2000, 42 p. 〈inria-00099176〉

Partager

Métriques

Consultations de la notice

239