Exploration prudente : une approche par méthode de Monte-Carlo arborescente contrainte - Inria - Institut national de recherche en sciences et technologies du numérique Accéder directement au contenu
Communication Dans Un Congrès Année : 2012

Exploration prudente : une approche par méthode de Monte-Carlo arborescente contrainte

Résumé

En robotique autonome, nous souhaitons permettre à l'agent d'explorer son environnement afin d'y effectuer les tâches désirées. Cette exploration autonome pose le problème de la sécurité de l'agent évoluant dans un environnement potentiellement dangereux. Cet article présente, dans un contexte d'apprentissage par renforcement, une implémentation d'exploration prudente par méthode de Monte-Carlo contrainte nommée Educated MCTS. Cette approche maintient à jour parallèlement à l'exploration un modèle permettant de se restreindre aux états proches de ceux connus et supposés sûrs. Les résultats expérimentaux montrent que Educated MCTS permet une amélioration significative du compromis exploration-sécurité
Fichier principal
Vignette du fichier
rfia2012_submission_153.pdf (584.85 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-00656575 , version 1 (17-01-2012)

Identifiants

  • HAL Id : hal-00656575 , version 1

Citer

Nicolas Galichet, Michèle Sebag. Exploration prudente : une approche par méthode de Monte-Carlo arborescente contrainte. RFIA 2012 (Reconnaissance des Formes et Intelligence Artificielle), Jan 2012, Lyon, France. pp.978-2-9539515-2-3. ⟨hal-00656575⟩
270 Consultations
913 Téléchargements

Partager

Gmail Facebook X LinkedIn More