Découverte de Politiques Interprétables pour l'Apprentissage par Renforcement via la Programmation Génétique - Inria - Institut national de recherche en sciences et technologies du numérique Accéder directement au contenu
Mémoires D'étudiants -- Hal-Inria+ Année : 2021

Découverte de Politiques Interprétables pour l'Apprentissage par Renforcement via la Programmation Génétique

Résumé

L'apprentissage par renforcement profond a connu un succès remarquable au cours des dernières années pour la résolution d'un large éventail de problèmes de contrôle difficiles. Les milliers de poids et non-linéarité constituant les réseaux de neurones, clef de voûte de cette approche, les rendent cependant incompréhensibles. Le présent rapport présente l'application de la programmation génétique à diverses tâches de contrôle. L'objectif de cette méthode est de produire des politiques symboliques interprétables. Tout d'abord, nous nous intéressons à la viabilité de ces politiques, aussi bien sûr le plan des performances que sur le plan de l'interprétabilité. Puis, nous explorions différentes stratégies pour échapper aux optimums locaux afin d'améliorer leurs performances. Nos résultats montrent que cette approche est une alternative crédible au réseau de neurones pour des tâches concrètes.
Fichier principal
Vignette du fichier
Videau2021_XGPRL_InternshipReport.pdf (1.89 Mo) Télécharger le fichier

Dates et versions

hal-03359238 , version 1 (30-09-2021)

Identifiants

  • HAL Id : hal-03359238 , version 1

Citer

Mathurin Videau. Découverte de Politiques Interprétables pour l'Apprentissage par Renforcement via la Programmation Génétique. Intelligence artificielle [cs.AI]. 2021. ⟨hal-03359238⟩
271 Consultations
177 Téléchargements

Partager

Gmail Facebook X LinkedIn More