8494 articles  [english version]

inria-00070417, version 1

Formalisme pour la construction automatique d'interactions dans les SMA réactifs - version étendue

Vincent Thomas 1, Christine Bourjot () 1, Vincent Chevrier () 1

N° RR-5590 (2005)

Résumé : Nous proposons un nouveau formalisme de représentation des actions et des interactions dans les SMA réactifs inspiré des processus de décision Markoviens décentralisés (DEC-MDP). Ce formalisme appelé Interac-DEC-MDP permet de représenter dans un même cadre homogène les actions individuelles et les interactions directes entre agents. Ainsi il permet de calculer automatiquement les prises de décisions des agents relativement aux actions et aux déclenchements et résolution des interactions par l'introduction de la rationalité au travers de la notion de récompense. Un premier problème simple de partage de ressources impliquant 2 agents a été modélisé selon le formalisme proposé et les comportements des agents ont été construits automatiquement par Q-learning. Les premiers résultats bien qu'obtenus avec des hypothèses limitatives montrent qu'il est possible à partir d'apprentissages simples de construire automatiquement des comportements collectifs pertinents.

  • 1 :  MAIA (INRIA Lorraine - LORIA)
  • INRIA – CNRS : UMR7503 – Université Henri Poincaré - Nancy I – Université Nancy II – Institut National Polytechnique de Lorraine (INPL)
  • Domaine : Informatique/Autre
  • Mots-clés : INTERACTION / APPRENTISSAGE / SMA RÉACTIFS / PROCESSUS DÉCISIONNELS DE MARKOV
  • Référence interne : RR-5590
 
  • inria-00070417, version 1
  • oai:hal.inria.fr:inria-00070417
  • Contributeur : 
  • Soumis le : Vendredi 19 Mai 2006, 20:26:01
  • Dernière modification le : Mercredi 28 Juin 2006, 11:08:12