"Réservoir computing" et Apprentissage par Renforcement Développemental

Alain Dutech 1
1 MAIA - Autonomous intelligent machine
Inria Nancy - Grand Est, LORIA - AIS - Department of Complex Systems, Artificial Intelligence & Robotics
Résumé : Dans cet article, nous présentons une architecture d'apprentissage par renforcement originale s'appuyant sur une carte neuronale auto-organisatrice dynamique pour intégrer une composante développementale à l'apprentissage. En suivant le schéma du "reservoir computing", la carte neuronale permet d'apprendre une approximation de la fonction de valeur dans un cadre où l'espace état × action est d'une taille conséquente. Pour appréhender la complexité inhérente à la taille du problème, nous proposons une approche développementale dans laquelle nous faisons augmenter la richesse et la complexité des espaces moteurs et perceptifs au fur et à mesure que les performances de l'agent apprenant s'accroissent. Nous détaillons les apports de cette proposition ainsi que les questions qu'elle soulève et explicitons notre architecture en la testant sur une tâche de robotique relativement simple.
Type de document :
Communication dans un congrès
Olivier Buffet. Journées Francophones sur la planification, la décision et l'apprentissage pour le contrôle des systèmes - JFPDA 2012, May 2012, Villers-lès-Nancy, France. 13 p, 2012
Liste complète des métadonnées

Littérature citée [12 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/hal-00736316
Contributeur : Olivier Buffet <>
Soumis le : vendredi 28 septembre 2012 - 08:56:41
Dernière modification le : jeudi 11 janvier 2018 - 02:01:46
Document(s) archivé(s) le : vendredi 16 décembre 2016 - 17:54:49

Fichier

17.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-00736316, version 1

Citation

Alain Dutech. "Réservoir computing" et Apprentissage par Renforcement Développemental. Olivier Buffet. Journées Francophones sur la planification, la décision et l'apprentissage pour le contrôle des systèmes - JFPDA 2012, May 2012, Villers-lès-Nancy, France. 13 p, 2012. 〈hal-00736316〉

Partager

Métriques

Consultations de la notice

155

Téléchargements de fichiers

136