Etude de différentes combinaisons de comportements adaptatives au sein d'un agent.

Olivier Buffet 1 Alain Dutech 1 François Charpillet 1
1 MAIA - Autonomous intelligent machine
INRIA Lorraine, LORIA - Laboratoire Lorrain de Recherche en Informatique et ses Applications
Résumé : Les travaux présentés ici s'intéressent à la synthèse automatique d'agents en environnement incertain. Nous avons ainsi fait le choix de nous placer dans le cadre de l'apprentissage par renforcement (A/R), et plus précisément des processus de décision markoviens partiellement observables (PDMPO). Une seconde décision a été de se restreindre à des agents travaillant sans modèle (de leur environnement) ni mémoire à court terme. Par contre, nous nous sommes particulièrement intéressés au cas d'agents confrontés à de multiples motivations (objectifs) simultanées. Cette problématique précise conduit assez directement aux travaux du domaine de la sélection d'action (S/A). Le présent article propose et évalue différentes architectures de sélection d'action pour le contrôle d'agents. Leur principe commun est de combiner de manière adaptative des comportements de base déjà connus, en apprenant (par renforcement) les réglages de la combinaison de manière à maximiser les gains de l'agent. Ces travaux ouvrent la voix vers une seconde étape dans laquelle les comportements de base eux-mêmes seraient sélectionnés et conçus de manière automatique.
Type de document :
Rapport
[Interne] A03-R-342 || buffet03d, 2003, 40 p
Liste complète des métadonnées

https://hal.inria.fr/inria-00099773
Contributeur : Publications Loria <>
Soumis le : mardi 26 septembre 2006 - 09:41:07
Dernière modification le : jeudi 11 janvier 2018 - 06:19:51

Identifiants

  • HAL Id : inria-00099773, version 1

Collections

Citation

Olivier Buffet, Alain Dutech, François Charpillet. Etude de différentes combinaisons de comportements adaptatives au sein d'un agent.. [Interne] A03-R-342 || buffet03d, 2003, 40 p. 〈inria-00099773〉

Partager

Métriques

Consultations de la notice

146