Skip to Main content Skip to Navigation
Reports

Etude de différentes combinaisons de comportements adaptatives au sein d'un agent.

Olivier Buffet 1 Alain Dutech 1 François Charpillet 1
1 MAIA - Autonomous intelligent machine
INRIA Lorraine, LORIA - Laboratoire Lorrain de Recherche en Informatique et ses Applications
Résumé : Les travaux présentés ici s'intéressent à la synthèse automatique d'agents en environnement incertain. Nous avons ainsi fait le choix de nous placer dans le cadre de l'apprentissage par renforcement (A/R), et plus précisément des processus de décision markoviens partiellement observables (PDMPO). Une seconde décision a été de se restreindre à des agents travaillant sans modèle (de leur environnement) ni mémoire à court terme. Par contre, nous nous sommes particulièrement intéressés au cas d'agents confrontés à de multiples motivations (objectifs) simultanées. Cette problématique précise conduit assez directement aux travaux du domaine de la sélection d'action (S/A). Le présent article propose et évalue différentes architectures de sélection d'action pour le contrôle d'agents. Leur principe commun est de combiner de manière adaptative des comportements de base déjà connus, en apprenant (par renforcement) les réglages de la combinaison de manière à maximiser les gains de l'agent. Ces travaux ouvrent la voix vers une seconde étape dans laquelle les comportements de base eux-mêmes seraient sélectionnés et conçus de manière automatique.
Document type :
Reports
Complete list of metadata

https://hal.inria.fr/inria-00099773
Contributor : Publications Loria <>
Submitted on : Tuesday, September 26, 2006 - 9:41:07 AM
Last modification on : Friday, February 26, 2021 - 3:28:05 PM

Identifiers

  • HAL Id : inria-00099773, version 1

Collections

Citation

Olivier Buffet, Alain Dutech, François Charpillet. Etude de différentes combinaisons de comportements adaptatives au sein d'un agent.. [Interne] A03-R-342 || buffet03d, 2003, 40 p. ⟨inria-00099773⟩

Share

Metrics

Record views

192