Etude de différentes combinaisons de comportements adaptatives.

Olivier Buffet 1 Alain Dutech 2 François Charpillet 2
2 MAIA - Autonomous intelligent machine
INRIA Lorraine, LORIA - Laboratoire Lorrain de Recherche en Informatique et ses Applications
Abstract : This article focusses on the automated synthesis of agents in an uncertain environment, working in the setting of Reinforcement Learning, and more precisely of Partially Observable Markov Decision Processes. The agents (with no model of their environment and no short-term memory) are facing multiple motivations/goals simultaneously, a problem related to the field of Action Selection. We propose and evaluate various Action Selection architectures. They all combine already known basic behaviors in an adaptive manner, by learning the tuning of the combination, so as to maximize the agent's payoff. %This work opens the way to a second step in which the basic behaviors themselves will be selected and designed in an automated manner. The logical continuation of this work is to automate the selection and design of the basic behaviors themselves.
Type de document :
Article dans une revue
Revue des Sciences et Technologies de l'Information - Série RIA : Revue d'Intelligence Artificielle, Lavoisier, 2006, Décision et planification dans l'incertain, 20 (2-3), pp.311-344
Liste complète des métadonnées

Littérature citée [29 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/inria-00119272
Contributeur : Alain Dutech <>
Soumis le : vendredi 8 décembre 2006 - 14:16:45
Dernière modification le : jeudi 11 janvier 2018 - 06:19:50
Document(s) archivé(s) le : mardi 6 avril 2010 - 20:42:17

Fichier

buffet_etudeCombComportement_R...
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : inria-00119272, version 1

Collections

Citation

Olivier Buffet, Alain Dutech, François Charpillet. Etude de différentes combinaisons de comportements adaptatives.. Revue des Sciences et Technologies de l'Information - Série RIA : Revue d'Intelligence Artificielle, Lavoisier, 2006, Décision et planification dans l'incertain, 20 (2-3), pp.311-344. 〈inria-00119272〉

Partager

Métriques

Consultations de la notice

317

Téléchargements de fichiers

175