Etude de différentes combinaisons de comportements adaptatives au sein d'un agent. - Inria - Institut national de recherche en sciences et technologies du numérique Accéder directement au contenu
Rapport Année : 2003

Etude de différentes combinaisons de comportements adaptatives au sein d'un agent.

Olivier Buffet
Alain Dutech

Résumé

Les travaux présentés ici s'intéressent à la synthèse automatique d'agents en environnement incertain. Nous avons ainsi fait le choix de nous placer dans le cadre de l'apprentissage par renforcement (A/R), et plus précisément des processus de décision markoviens partiellement observables (PDMPO). Une seconde décision a été de se restreindre à des agents travaillant sans modèle (de leur environnement) ni mémoire à court terme. Par contre, nous nous sommes particulièrement intéressés au cas d'agents confrontés à de multiples motivations (objectifs) simultanées. Cette problématique précise conduit assez directement aux travaux du domaine de la sélection d'action (S/A). Le présent article propose et évalue différentes architectures de sélection d'action pour le contrôle d'agents. Leur principe commun est de combiner de manière adaptative des comportements de base déjà connus, en apprenant (par renforcement) les réglages de la combinaison de manière à maximiser les gains de l'agent. Ces travaux ouvrent la voix vers une seconde étape dans laquelle les comportements de base eux-mêmes seraient sélectionnés et conçus de manière automatique.
Fichier non déposé

Dates et versions

inria-00099773 , version 1 (26-09-2006)

Identifiants

  • HAL Id : inria-00099773 , version 1

Citer

Olivier Buffet, Alain Dutech, François Charpillet. Etude de différentes combinaisons de comportements adaptatives au sein d'un agent.. [Interne] A03-R-342 || buffet03d, 2003, 40 p. ⟨inria-00099773⟩
73 Consultations
0 Téléchargements

Partager

Gmail Facebook X LinkedIn More