Reconstruction d'état caché avec cartes auto-organisatrices récurrentes

Résumé : Quand les ´etats d’un processus ne sont pas Markoviens (POMDP par exemple), la convergence des algorithmes d’apprentissage par renforcement n’est pas garantie. Une solution est de reconstruire un processus Markovien en partant de la s´equence des ´etats. Dans ce but, nous explorons les capacit´es d’architectures r´ecurrentes qui s’appuient sur des cartes neuronales autoorganisatrices pour apprendre `a pr´edire des s´equences d’observations issues de HMM.
Document type :
Conference papers
Complete list of metadatas

https://hal.inria.fr/hal-01840627
Contributor : Olivier Buffet <>
Submitted on : Monday, July 16, 2018 - 3:18:48 PM
Last modification on : Tuesday, September 4, 2018 - 1:15:08 AM
Long-term archiving on : Wednesday, October 17, 2018 - 2:44:21 PM

File

JFPDA_2018_paper_7.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : hal-01840627, version 1

Citation

Alain Dutech, Jérémy Fix, Hervé Frezza-Buet. Reconstruction d'état caché avec cartes auto-organisatrices récurrentes. JFPDA 2018 - Journées Francophones sur la Planification, la Décision et l'Apprentissage pour la conduite de systèmes, Jul 2018, Nancy, France. pp.1-3. ⟨hal-01840627⟩

Share

Metrics

Record views

357

Files downloads

38