Filtrer vos résultats
- 146
- 33
- 81
- 36
- 35
- 12
- 10
- 3
- 2
- 6
- 164
- 21
- 18
- 7
- 5
- 2
- 1
- 1
- 788
- 659
- 609
- 589
- 532
- 478
- 431
- 391
- 369
- 324
- 320
- 317
- 312
- 307
- 304
- 294
- 290
- 283
- 266
- 259
- 251
- 226
- 219
- 218
- 218
- 218
- 216
- 215
- 213
- 211
- 210
- 205
- 201
- 201
- 200
- 197
- 195
- 193
- 192
- 191
- 191
- 189
- 183
- 182
- 179
- 179
- 178
- 176
- 174
- 171
- 170
- 167
- 164
- 162
- 161
- 161
- 159
- 157
- 157
- 156
- 155
- 154
- 154
- 152
- 152
- 152
- 150
- 150
- 149
- 148
- 147
- 147
- 144
- 142
- 142
- 141
- 141
- 141
- 140
- 139
- 139
- 138
- 138
- 137
- 137
- 136
- 136
- 136
- 136
- 136
- 135
- 135
- 133
- 132
- 131
- 131
- 131
- 131
- 131
- 128
- 1
- 22
- 29
- 9
- 11
- 8
- 8
- 4
- 11
- 5
- 4
- 3
- 5
- 2
- 3
- 8
- 7
- 5
- 1
- 6
- 17
- 6
- 3
- 1
- 156
- 23
- 52
- 42
- 39
- 26
- 24
- 22
- 14
- 13
- 13
- 11
- 11
- 10
- 9
- 9
- 9
- 8
- 7
- 4
- 3
- 3
- 3
- 3
- 3
- 3
- 3
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 16
- 13
- 13
- 11
- 10
- 6
- 5
- 5
- 5
- 4
- 4
- 4
- 4
- 3
- 3
- 3
- 3
- 3
- 3
- 3
- 3
- 3
- 3
- 3
- 3
- 3
- 3
- 3
- 3
- 3
- 3
- 3
- 3
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
|
On the Possibility of Learning in Reactive Environments with Arbitrary DependenceTheoretical Computer Science, 2008, 405 (3), pp.274-284. ⟨10.1016/j.tcs.2008.06.039⟩
Article dans une revue
hal-00639569v1
|
||
|
Apprentissage par renforcement développementalIntelligence artificielle [cs.AI]. Université de Lorraine, 2018. Français. ⟨NNT : 2018LORR0008⟩
Thèse
tel-01735202v1
|
||
|
An Autonomic Testing Framework for IPv6 Configuration Protocols4th International Conference on Autonomous Infrastructure, Management and Security - AIMS 2010, University of Zurich, Jun 2010, Zurich, Switzerland. pp.65-76, ⟨10.1007/978-3-642-13986-4_7⟩
Communication dans un congrès
inria-00546171v1
|
||
|
Feature discovery in reinforcement learning using genetic programming11th European Conference on Genetic Programming (EUROGP), 2008, Naples, Italy. pp.218-229
Communication dans un congrès
hal-00826056v1
|
||
|
RISCLESS: A Reinforcement Learning Strategy to Guarantee SLA on Cloud Ephemeral and Stable Resources2022 30th Euromicro International Conference on Parallel, Distributed and Network-Based Processing (PDP), Mar 2022, Valladolid, Spain. pp.83-87, ⟨10.1109/PDP55904.2022.00021⟩
Communication dans un congrès
hal-03921309v2
|
||
|
Reinforcement Learning for Radio Resource Management of Hybrid-Powered Cellular NetworksWiMob 2019 : Twelfth International Conference on Wireless and Mobile Computing, Networking and Communications, IEEE, Oct 2019, Barcelona, Spain. ⟨10.1109/WiMOB.2019.8923481⟩
Communication dans un congrès
hal-02294149v1
|
||
|
Vocal Imitation in Sensorimotor Learning Models: a Comparative ReviewIEEE Transactions on Cognitive and Developmental Systems, 2020, ⟨10.1109/TCDS.2020.3041179⟩
Article dans une revue
hal-02317144v2
|
||
Apprentissage de modèles en télémédecineConférence Francophone d'Apprentissage - CAP 2002, Matthieu Exbrayat, 2002, Orléans, France, 2 p
Communication dans un congrès
inria-00100813v1
|
|||
Proceedings of the Sixth European Workshop on Reinforcement LearningSixth European Workshop on Reinforcement Learning - EWRL-6, Olivier Buffet, Iadine Chadès, Alain Dutech, Frédérick Garcia, 2003, Nancy, France, 50 p
Communication dans un congrès
inria-00099829v1
|
|||
Coordination through Mutual Notification in Cooperative Multiagent Reinforcement Learning[Intern report] A04-R-051 || szer04a, 2004, 8 p
Rapport
inria-00100215v1
|
|||
Apprentissage par Renforcement pour la Conception de Systèmes Multi-Agents[Interne] A02-R-108 || buffet02c, 2002, 29 p
Rapport
inria-00100787v1
|
|||
Etude de différentes combinaisons de comportements adaptatives au sein d'un agent.[Interne] A03-R-342 || buffet03d, 2003, 40 p
Rapport
inria-00099773v1
|
|||
|
Improvements on Learning Tetris with Cross EntropyInternational Computer Games Association Journal, 2009, 32
Article dans une revue
inria-00418930v1
|
||
|
Feature Discovery in Reinforcement Learning using Genetic Programming[Research Report] INRIA. 2007
Rapport
inria-00187997v2
|
||
Decentralized control in the pursuit domain[Internship report] A03-R-171 || aras03a, 2003, 59 p
Rapport
inria-00099539v1
|
|||
|
High-Dimensional Control Using Generalized Auxiliary Tasks2019
Pré-publication, Document de travail
hal-02295705v3
|
||
|
Select or Suggest? Reinforcement Learning-based Method for High-Accuracy Target Selection on TouchscreensCHI 2022 - ACM Conference on Human Factors in Computing Systems, Apr 2022, New Orleans, LA, United States. pp.1-15, ⟨10.1145/3491102.3517472⟩
Communication dans un congrès
hal-03664185v1
|
||
|
Toward adaptation in human-robot collaborationRobotics [cs.RO]. Universite de Lorraine, 2022. English. ⟨NNT : 2022LORR0245⟩
Thèse
tel-03998070v1
|
||
|
Learning a Move-Generator for Upper Con dence TreesInternational Computer Symposium 2012, Dec 2012, Hualien, Taiwan
Communication dans un congrès
hal-00759822v1
|
||
|
Open-Ended Learning: A Conceptual Framework Based on Representational RedescriptionFrontiers in Neurorobotics, 2018, 12, pp.59. ⟨10.3389/fnbot.2018.00059⟩
Article dans une revue
hal-01889947v1
|
||
|
Temporal Difference Learning with Continuous Time and State in the Stochastic Setting2023
Pré-publication, Document de travail
hal-03574645v3
|
||
|
Steering undulatory micro-swimmers in a fluid flow through reinforcement learningEuropean Physical Journal E: Soft matter and biological physics, 2023, 46 (6), pp.43. ⟨10.1140/epje/s10189-023-00293-8⟩
Article dans une revue
hal-04058675v1
|
||
|
Apprentissage de représentation et auto-organisation modulaire pour un agent autonomeInterface homme-machine [cs.HC]. Université Henri Poincaré - Nancy I, 2003. Français. ⟨NNT : 2003NAN10018⟩
Thèse
tel-00003377v1
|
||
|
Performance Bounds in $L_p$ norm for Approximate Value IterationSIAM Journal on Control and Optimization, 2007, 46 (2), pp.541-561. ⟨10.1137/040614384⟩
Article dans une revue
inria-00124685v1
|
||
|
Des agents intelligents dans un environnement de communication multimédia : Vers la conception de services adaptatifsAutre [cs.OH]. Université Henri Poincaré - Nancy I, 2003. Français. ⟨NNT : ⟩
Thèse
tel-00004910v1
|
||
|
Sampling and inference in complex networksOther [cs.OH]. COMUE Université Côte d'Azur (2015 - 2019), 2016. English. ⟨NNT : 2016AZUR4121⟩
Thèse
tel-01485852v1
|
||
|
The Ecology of Open-Ended Skill AcquisitionArtificial Intelligence [cs.AI]. Université de Bordeaux (UB), 2022
HDR
tel-03875448v1
|
||
|
Multi-Armed Bandit Algorithm for Spatial Reuse in WLANs : Minimizing Stations in Starvation23ème congrès annuel de la Société Française de Recherche Opérationnelle et d'Aide à la Décision, ROADEF'22, 2022, Lyon, France
Communication dans un congrès
hal-03643750v1
|
||
|
Basis Expansion in Natural Actor Critic MethodsEuropean Workshop on Reinforcement Learning, Jun 2008, Villeneuve d'Ascq, France. pp.110-123
Communication dans un congrès
hal-00826055v1
|
||
|
Scalable Model-Free Algorithms for Influencer MarketingArtificial Intelligence [cs.AI]. Université Paris-Saclay, 2023. English. ⟨NNT : 2023UPASG012⟩
Thèse
tel-04126471v1
|