Toggle navigation
HAL
HAL
HALSHS
TEL
MédiHAL
Liste des portails
AURéHAL
API
Documentation
Episciences.org
Sciencesconf.org
Support
Connexion
Connexion
Créer un compte
Mot de passe oublié ?
Login oublié ?
fr
en
Accueil
Déposer
Consulter
par date de publication/rédaction
par domaine
par type de publication
par collection
arXiv
Consultation les derniers dépôts
Recherche
Services
HalTools : créer sa page web
Haltools : export RAWEB
Bib2Hal : import par lot à partir d'un fichier BibTeX
Consulter les structures de recherche connues de HAL
Documentation
Aide en ligne de HAL V3
Dernières évolutions de HAL V3
Documentation API HAL
Ajouter des vignettes
Aide en ligne Haltools
Aide en ligne de Bib2hal
OpenAccess@Inria
Supports
Recherche
Filtres
Sous-domaine niveau 1 ×
Auteur : IdHal (chaîne de caractères) ×
Tous ×
16 résultats
enregistrer la recherche
Type de document
Communication dans un congrès
(8)
Article dans une revue
(4)
Rapport
(2)
HDR
(1)
Pré-publication, Document de travail
(1)
Auteur
Bruno Scherrer
(16)
Matthieu Geist
(4)
Boris Lesner
(3)
Manel Tagorti
(3)
Mohammad Ghavamzadeh
(2)
Victor Gabillon
(2)
Bilal Piot
(1)
Christophe Thiery
(1)
Alain Dutech
(1)
Julien Pérolat
(1)
Olivier Pietquin
(1)
Discipline
Informatique [cs]
(16)
Mathématiques [math]
(16)
Statistiques [stat]
(2)
Structure
Inria Nancy - Grand Est
(16)
Laboratoire Lorrain de Recherche en Informatique et ses Applications
(14)
Institut Élie Cartan de Lorraine
(5)
SUPELEC-Campus Metz
(4)
Inria Lille - Nord Europe
(3)
Centre de Recherche en Informatique, Signal et Automatique de Lille - UMR 9189
(2)
Georgia Tech - CNRS [Metz]
(2)
Institut Universitaire de France
(1)
Laboratoire d'Automatique, Génie Informatique et Signal
(1)
Laboratoire d'Informatique Fondamentale de Lille
(1)
Collection
CNRS
(16)
INRIA
(16)
INRIA-LORRAINE
(16)
INRIA-NANCY-GRAND-EST
(16)
INRIA2
(16)
INRIA_TEST
(16)
INSMI
(16)
TDS-MACS
(16)
UNIV-LORRAINE
(16)
LORIA
(14)
LORIA-AIS
(14)
LORIA2
(14)
IECN
(5)
CENTRALESUPELEC
(3)
EC-LILLE
(3)
INRIA-LILLE
(3)
SUP_IMS
(3)
TESTANNE
(3)
UMI-GTL
(3)
UNIV-LILLE3
(3)
CENTRALESUPELEC-SACLAY
(2)
CRISTAL
(2)
GRID5000
(2)
LARA
(2)
MALIS
(2)
SUPELEC
(2)
UMI-COMPUTERSCIENCE
(2)
UNIV-FCOMTE
(2)
UNIV-PARIS-SACLAY
(2)
CRISTAL-SEQUEL
(1)
IDM
(1)
INRIA-MECSCI
(1)
LAGIS
(1)
NANCY-2014
(1)
Langue
anglais
(10)
français
(6)
Type de dépôt
Document
(14)
Notice
(2)
Année
2016
(2)
2015
(3)
2014
(4)
2013
(7)
Rechercher
Recherche avancée…
Recherche simple…
Champ de recherche par défaut (multicritères)
Champ de recherche par défaut (multicritères)
Champ de recherche par défaut (multicritères) + texte intégral des PDF
Titres
Sous-titre
Titre de l'ouvrage
Résumé
Texte intégral indexé des documents PDF
Mots-clés
Tous les identifiants du document
Identifiant HAL du dépôt
Langue du document (texte)
Pays (Texte)
Ville
Auteur (multicritères)
Auteur : Nom complet
Auteur : Nom de famille
Auteur : Prénom
Auteur : Complément de nom, deuxième prénom
Auteur : Organisme payeur
Auteur : IdHal (chaîne de caractères)
Auteur : Fonction
Auteur : idHal numérique
Auteur : Identifiant
Auteur : Identifiant de l'organisme payeur
Auteur : Identifiant de la structure
Directeur de thèse
Éditeur
Éditeur scientifique
Éditeur de la série
Revues (multicritères)
Revue : Éditeur
Revue : Titre abrégé
Revue : Titre
Revue : Identifiant interne
Revue : Date de début de publication
Revue : ISSN électronique
Revue : ISSN
Revue : Éditeur
Revue : Couleur dans SHERPA/RoMEO
Revue : État dans le référentiel
Colloque (multicritères)
Colloque : Titre
Colloque : Organisateur
Colloque : date de début (Année)
Colloque : date de fin (Année)
Projets ANR (multicritères)
Projet ANR : Acronyme
Projet ANR : Acronyme de l'appel à projet
Projet ANR : Nom de l'appel à projet
Projet ANR : Référence
Projet ANR : Nom
Projet ANR : Identifiant interne
Projet ANR : État dans le référentiel
Projets européens (multicritères)
Projet européen : Acronyme
Projet européen : Identifiant de l'appel à projet
Projet européen : Référence
Projet européen : Nom
Projet européen : Date de fin
Projet européen : Financement
Projet européen : Date de début
Projet européen : État dans le référentiel
Projet européen : Identifiant interne
Structure (multicritères)
Structure : Acronyme
Structure : Nom
Structure : Code
Structure : Pays
Structure : Type
Structure : État dans le référentiel
Structure : Identifiant HAL de la structure
Date de publication : année
Date de mise en ligne : année
Date d'écriture : année
Date de modification du dépôt : année
Date de dépôt : année
Date de publication électronique : année
Collection HAL (multicritères)
Collection HAL : catégorie
Collection HAL : Code
Collection HAL : Nom
Collection HAL : Identifiant interne
Identifiant interne du contributeur/déposant
Nom complet du contributeur/déposant
Domaines
Domaine primaire
Domaine racine
Sous-domaine niveau 1
Sous-domaine niveau 2
Sous-domaine niveau 3
Statut du document
Version du document
Type de dépôt
Type de document
ISBN
Numéro - référence
Identifiant DOI
Classification
Audience
Vulgarisation
Comité de lecture - texte (oui ou non)
Actes de colloque
Référence interne
Financement
Collaborations
Enregistrement réussi
Mes recherches enregistrées / mes alertes
Une erreur est survenue lors de l'enregistrement
Tri
Pertinence
Auteur A→Z
Auteur Z→A
Titre A→Z
Titre Z→A
Date de publication croissante
Date de publication décroissante
Date de dépôt croissante
Date de dépôt décroissante
Nombre
30 résultats par page
50 résultats par page
100 résultats par page
Outils
Pour les 16 documents
Exporter
XML-TEI
BibTeX
EndNote
CSV
PDF
Export avancé...
Syndication
RSS
ATOM
tel-01400208
v1
HDR
Bruno Scherrer
.
Contributions algorithmiques au contrôle optimal stochastique à temps discret et horizon infini
Optimisation et contrôle [math.OC]. Université de Lorraine (Nancy), 2016
hal-00921261
v1
Communication dans un congrès
Bruno Scherrer
.
Improved and Generalized Upper Bounds on the Complexity of Policy Iteration
Neural Information Processing Systems (NIPS) 2013
, Dec 2013, South Lake Tahoe, United States. 2013
hal-00921287
v1
Communication dans un congrès
Bruno Scherrer
.
Quelques majorants de la complexité d'itérations sur les politiques
JFPDA - 8èmes Journées Francophones sur la Planification, la Décision et l'Apprentissage pour la conduite de systèmes - 2013
, Jul 2013, Lille, France. 2013
hal-00921291
v1
Communication dans un congrès
Bruno Scherrer
,
Boris Lesner
.
Sur l'utilisation de politiques non-stationnaires pour les processus de décision Markoviens à horizon infini
JFPDA - 8èmes Journées Francophones sur la Planification, la Décision et l'Apprentissage pour la conduite de systèmes - 2013
, Jul 2013, Lille, France. 2013
hal-00922142
v1
Article dans une revue
Alain Dutech
,
Bruno Scherrer
,
Christophe Thiery
.
La carotte et le bâton... et Tetris
Images des Mathématiques
, CNRS, 2013
hal-00989991
v1
Rapport
Bruno Scherrer
.
Une étude comparative de quelques schémas d'approximation de type iterations sur les politiques
[Rapport de recherche] 2014
hal-00990508
v1
Communication dans un congrès
Manel Tagorti
,
Bruno Scherrer
.
Vitesse de convergence et borne d'erreur pour l'algorithme LSTD($\lambda$)
JFPDA - 9èmes Journées Francophones sur la Planification, la Décision et l'Apprentissage pour la conduite de systèmes
, May 2014, Liège, Belgique. 2014
hal-00990525
v1
Rapport
Manel Tagorti
,
Bruno Scherrer
.
Rate of Convergence and Error Bounds for LSTD($\lambda$)
[Research Report] 2014
hal-01186664
v1
Communication dans un congrès
Boris Lesner
,
Bruno Scherrer
.
Non-Stationary Approximate Modified Policy Iteration
ICML 2015
, Jul 2015, Lille, France. 2015
hal-01186667
v1
Communication dans un congrès
Manel Tagorti
,
Bruno Scherrer
.
On the Rate of Convergence and Error Bounds for LSTD(λ)
ICML 2015
, Jul 2015, Lille, France. 2015
hal-00829548
v1
Pré-publication, Document de travail
Bruno Scherrer
,
Matthieu Geist
.
Policy Search: Any Local Optimum Enjoys a Global Performance Guarantee
2013
hal-00759102
v2
Article dans une revue
Bruno Scherrer
.
Performance Bounds for Lambda Policy Iteration and Application to the Game of Tetris
Journal of Machine Learning Research
, Journal of Machine Learning Research, 2013, 14, pp.1175-1221
hal-00921275
v1
Article dans une revue
Matthieu Geist
,
Bruno Scherrer
.
Off-policy Learning with Eligibility Traces: A Survey
Journal of Machine Learning Research
, Journal of Machine Learning Research, 2014, 15 (1), pp.289-333
hal-01091341
v1
Article dans une revue
Bruno Scherrer
,
Mohammad Ghavamzadeh
,
Victor Gabillon
,
Boris Lesner
,
Matthieu Geist
.
Approximate Modified Policy Iteration and its Application to the Game of Tetris
Journal of Machine Learning Research
, Journal of Machine Learning Research, 2015, 16, pp.1629−1676
hal-01393328
v1
Communication dans un congrès
Julien Pérolat
,
Bilal Piot
,
Matthieu Geist
,
Bruno Scherrer
,
Olivier Pietquin
.
Softened Approximate Policy Iteration for Markov Games
ICML 2016 - 33rd International Conference on Machine Learning
, Jun 2016, New York City, United States
hal-00921250
v1
Communication dans un congrès
Victor Gabillon
,
Mohammad Ghavamzadeh
,
Bruno Scherrer
.
Approximate Dynamic Programming Finally Performs Well in the Game of Tetris
Neural Information Processing Systems (NIPS) 2013
, Dec 2013, South Lake Tahoe, United States. 2013
Tri
Pertinence
Auteur A→Z
Auteur Z→A
Titre A→Z
Titre Z→A
Date de publication croissante
Date de publication décroissante
Date de dépôt croissante
Date de dépôt décroissante
Nombre
30 résultats par page
50 résultats par page
100 résultats par page
Outils
Pour les 16 documents
Exporter
XML-TEI
BibTeX
EndNote
CSV
PDF
Export avancé...
Syndication
RSS
ATOM
Enregistrer
Annuler
Libellé
Des champs obligatoires n'ont pas été remplis.