Généralisation Min Max pour l'Apprentissage par Renforcement Batch et Déterministe : Schémas de Relaxation

Résumé : On s'intéresse au problème de généralisation min max dans le cadre de l'apprentissage par renforcement batch et déterministe. Le problème a été originellement introduit par Fonteneau et al. (2011). Dans un premier temps, on montre que le problème est NP-dur. Dans le cas où l'horizon d'optimisation vaut 2, on développe deux schémas de relaxation. Le premier schéma fonctionne en éliminant des contraintes de telle sorte qu'on obtienne un problème soluble en temps polynomial. Le deuxième schéma est une relaxation Lagrangienne conduisant à un problème conique-quadratique. On montre théoriquement et empiriquement que ces deux schémas permettent d'obtenir de meilleurs résultats que ceux proposés par Fonteneau et al. (2011).
Type de document :
Communication dans un congrès
Olivier Buffet. Journées Francophones sur la planification, la décision et l'apprentissage pour le contrôle des systèmes - JFPDA 2012, May 2012, Villers-lès-Nancy, France. 16 p, 2012
Liste complète des métadonnées

Littérature citée [44 références]  Voir  Masquer  Télécharger

https://hal.inria.fr/hal-00736325
Contributeur : Olivier Buffet <>
Soumis le : vendredi 28 septembre 2012 - 09:08:05
Dernière modification le : vendredi 28 septembre 2012 - 10:11:10
Document(s) archivé(s) le : vendredi 16 décembre 2016 - 18:58:43

Fichier

8.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-00736325, version 1

Collections

Citation

Raphael Fonteneau, Damien Ernst, Bernard Boigelot, Quentin Louveaux. Généralisation Min Max pour l'Apprentissage par Renforcement Batch et Déterministe : Schémas de Relaxation. Olivier Buffet. Journées Francophones sur la planification, la décision et l'apprentissage pour le contrôle des systèmes - JFPDA 2012, May 2012, Villers-lès-Nancy, France. 16 p, 2012. 〈hal-00736325〉

Partager

Métriques

Consultations de la notice

114

Téléchargements de fichiers

52