"Réservoir computing" et Apprentissage par Renforcement Développemental

Alain Dutech

Communication Dans Un Congrès Année : 2012

"Réservoir computing" et Apprentissage par Renforcement Développemental

(1)

Alain Dutech

Fonction : Auteur
PersonId : 1580
IdHAL : alain-dutech
ORCID : 0000-0001-7549-7988
IdRef : 131102532

Autonomous intelligent machine

Résumé

Dans cet article, nous présentons une architecture d'apprentissage par renforcement originale s'appuyant sur une carte neuronale auto-organisatrice dynamique pour intégrer une composante développementale à l'apprentissage. En suivant le schéma du "reservoir computing", la carte neuronale permet d'apprendre une approximation de la fonction de valeur dans un cadre où l'espace état × action est d'une taille conséquente. Pour appréhender la complexité inhérente à la taille du problème, nous proposons une approche développementale dans laquelle nous faisons augmenter la richesse et la complexité des espaces moteurs et perceptifs au fur et à mesure que les performances de l'agent apprenant s'accroissent. Nous détaillons les apports de cette proposition ainsi que les questions qu'elle soulève et explicitons notre architecture en la testant sur une tâche de robotique relativement simple.

Domaines

Intelligence artificielle [cs.AI]

Fichier principal

17.pdf (1.83 Mo)

Origine : Fichiers produits par l'(les) auteur(s)

Olivier Buffet : Connectez-vous pour contacter le contributeur

https://inria.hal.science/hal-00736316

Soumis le : vendredi 28 septembre 2012-08:56:41

Dernière modification le : jeudi 1 février 2024-10:06:00

Archivage à long terme le : vendredi 16 décembre 2016-17:54:49

Dates et versions

hal-00736316 , version 1 (28-09-2012)

Identifiants

HAL Id : hal-00736316 , version 1

Citer

Alain Dutech. "Réservoir computing" et Apprentissage par Renforcement Développemental. Journées Francophones sur la planification, la décision et l'apprentissage pour le contrôle des systèmes - JFPDA 2012, May 2012, Villers-lès-Nancy, France. 13 p. ⟨hal-00736316⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

UNIV-RENNES1 CNRS INRIA IRISA JFPDA2012 UNIV-LORRAINE INRIA2 LORIA LORIA-AIS UR1-MATH-STIC UR1-UFR-ISTIC UNIV-RENNES UR1-MATH-NUM

115 Consultations

183 Téléchargements

"Réservoir computing" et Apprentissage par Renforcement Développemental

Résumé

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager