Etude de différentes combinaisons de comportements adaptatives au sein d'un agent.

Olivier Buffet; Alain Dutech; François Charpillet

Rapport Année : 2003

Etude de différentes combinaisons de comportements adaptatives au sein d'un agent.

(1) , (1) , (1)

Olivier Buffet

Fonction : Auteur
PersonId : 1407
IdHAL : olivier-buffet
ORCID : 0000-0002-5072-5857

Autonomous intelligent machine

Alain Dutech

Fonction : Auteur
PersonId : 1580
IdHAL : alain-dutech
ORCID : 0000-0001-7549-7988
IdRef : 131102532

Autonomous intelligent machine

François Charpillet

Fonction : Auteur
PersonId : 1910
IdHAL : francois-charpillet
ORCID : 0000-0001-8260-1536
IdRef : 070140553

Autonomous intelligent machine

Résumé

Les travaux présentés ici s'intéressent à la synthèse automatique d'agents en environnement incertain. Nous avons ainsi fait le choix de nous placer dans le cadre de l'apprentissage par renforcement (A/R), et plus précisément des processus de décision markoviens partiellement observables (PDMPO). Une seconde décision a été de se restreindre à des agents travaillant sans modèle (de leur environnement) ni mémoire à court terme. Par contre, nous nous sommes particulièrement intéressés au cas d'agents confrontés à de multiples motivations (objectifs) simultanées. Cette problématique précise conduit assez directement aux travaux du domaine de la sélection d'action (S/A). Le présent article propose et évalue différentes architectures de sélection d'action pour le contrôle d'agents. Leur principe commun est de combiner de manière adaptative des comportements de base déjà connus, en apprenant (par renforcement) les réglages de la combinaison de manière à maximiser les gains de l'agent. Ces travaux ouvrent la voix vers une seconde étape dans laquelle les comportements de base eux-mêmes seraient sélectionnés et conçus de manière automatique.

Mots clés

processus de décision markoviens sélection d'action motivations multiples multiple motivations apprentissage par renforcement reinforcement learning markov decision processes action selection

Domaines

Autre [cs.OH]

Publications Loria : Connectez-vous pour contacter le contributeur

https://inria.hal.science/inria-00099773

Soumis le : mardi 26 septembre 2006-09:41:07

Dernière modification le : jeudi 15 février 2024-03:31:50

Dates et versions

inria-00099773 , version 1 (26-09-2006)

Identifiants

HAL Id : inria-00099773 , version 1

Citer

Olivier Buffet, Alain Dutech, François Charpillet. Etude de différentes combinaisons de comportements adaptatives au sein d'un agent.. [Interne] A03-R-342 || buffet03d, 2003, 40 p. ⟨inria-00099773⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

UNIV-RENNES1 CNRS INRIA IRISA UNIV-LORRAINE INRIA2 LORIA LARA UR1-MATH-STIC UR1-UFR-ISTIC UNIV-RENNES UR1-MATH-NUM

73 Consultations

0 Téléchargements

Etude de différentes combinaisons de comportements adaptatives au sein d'un agent.

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager