Apprentissage par renforcement pour les processus décisionnels de Markov partiellement observés.

Alain Dutech; Manuel Samuelides

Article Dans Une Revue Revue des Sciences et Technologies de l'Information - Série RIA : Revue d'Intelligence Artificielle Année : 2003

Apprentissage par renforcement pour les processus décisionnels de Markov partiellement observés.

(1) , (2)

1
2

Alain Dutech

Fonction : Auteur
PersonId : 1580
IdHAL : alain-dutech
ORCID : 0000-0001-7549-7988
IdRef : 131102532

Autonomous intelligent machine

Manuel Samuelides

Fonction : Auteur

École nationale supérieure de l'aéronautique et de l'espace

Résumé

Nous présentons un nouvel algorithme qui contribue à étendre le formalisme de l'Apprentissage par Renforcement (RL) aux Processus Décisionnels Markoviens Partiellement Observés (POMDP). L'idée principale de notre méthode est de construire une extension d'état, appelée observable exhaustif, qui permet de définir un nouveau processus qui est alors markovien. Nous démontrons que résoudre ce nouveau processus, auquel on peut appliquer les techniques classiques de RL, apporte une solution optimale au POMDP original. Nous appliquons l'algorithme déduit de ce résultat sur plusieurs exemples pour en tester la validité et la robustesse. || We present a new algorithm that extends the Reinforcement Learning framework to Partially Observed Markov Decision Processes (POMDP). The main idea of our method is to build a state extension, called exhaustive observable, which allow us to define a next

Mots clés

decision theory intelligent agent reinforcement learning pomdp agent intelligent apprentissage par renforcement extension d'état state extension théorie décision

Domaines

Autre [cs.OH]

Publications Loria : Connectez-vous pour contacter le contributeur

https://inria.hal.science/inria-00099563

Soumis le : mardi 26 septembre 2006-09:38:45

Dernière modification le : jeudi 15 février 2024-03:31:29

Dates et versions

inria-00099563 , version 1 (26-09-2006)

Identifiants

HAL Id : inria-00099563 , version 1

Citer

Alain Dutech, Manuel Samuelides. Apprentissage par renforcement pour les processus décisionnels de Markov partiellement observés.. Revue des Sciences et Technologies de l'Information - Série RIA : Revue d'Intelligence Artificielle, 2003, 17 (4), pp.559-589. ⟨inria-00099563⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

UNIV-RENNES1 CNRS INRIA IRISA UNIV-LORRAINE INRIA2 LORIA UR1-MATH-STIC UR1-UFR-ISTIC UNIV-RENNES UR1-MATH-NUM

332 Consultations

1 Téléchargements

Apprentissage par renforcement pour les processus décisionnels de Markov partiellement observés.

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager