Recherche - INRIA - Institut National de Recherche en Informatique et en Automatique Accéder directement au contenu

Filtrer vos résultats

179 résultats
keyword_s : Reinforcement learning

On the Possibility of Learning in Reactive Environments with Arbitrary Dependence

Daniil Ryabko , Marcus Hutter
Theoretical Computer Science, 2008, 405 (3), pp.274-284. ⟨10.1016/j.tcs.2008.06.039⟩
Article dans une revue hal-00639569v1
Image document

Apprentissage par renforcement développemental

Matthieu Zimmer
Intelligence artificielle [cs.AI]. Université de Lorraine, 2018. Français. ⟨NNT : 2018LORR0008⟩
Thèse tel-01735202v1
Image document

An Autonomic Testing Framework for IPv6 Configuration Protocols

Sheila Becker , Humberto Abdelnur , Radu State , Thomas Engel
4th International Conference on Autonomous Infrastructure, Management and Security - AIMS 2010, University of Zurich, Jun 2010, Zurich, Switzerland. pp.65-76, ⟨10.1007/978-3-642-13986-4_7⟩
Communication dans un congrès inria-00546171v1
Image document

Feature discovery in reinforcement learning using genetic programming

Sertan Girgin , Philippe Preux
11th European Conference on Genetic Programming (EUROGP), 2008, Naples, Italy. pp.218-229
Communication dans un congrès hal-00826056v1
Image document

RISCLESS: A Reinforcement Learning Strategy to Guarantee SLA on Cloud Ephemeral and Stable Resources

Sidahmed Yalles , Mohamed Handaoui , Jean-Emile Dartois , Olivier Barais , Laurent d'Orazio , et al.
2022 30th Euromicro International Conference on Parallel, Distributed and Network-Based Processing (PDP), Mar 2022, Valladolid, Spain. pp.83-87, ⟨10.1109/PDP55904.2022.00021⟩
Communication dans un congrès hal-03921309v2
Image document

Reinforcement Learning for Radio Resource Management of Hybrid-Powered Cellular Networks

Hadi Sayed , Ali El Amine , Hussein Al Haj Hassan , Loutfi Nuaymi , Roger Achkar
WiMob 2019 : Twelfth International Conference on Wireless and Mobile Computing, Networking and Communications, IEEE, Oct 2019, Barcelona, Spain. ⟨10.1109/WiMOB.2019.8923481⟩
Communication dans un congrès hal-02294149v1
Image document

Vocal Imitation in Sensorimotor Learning Models: a Comparative Review

Silvia Pagliarini , Arthur Leblois , Xavier Hinaut
IEEE Transactions on Cognitive and Developmental Systems, 2020, ⟨10.1109/TCDS.2020.3041179⟩
Article dans une revue hal-02317144v2

Apprentissage de modèles en télémédecine

Laurent Jeanpierre , François Charpillet
Conférence Francophone d'Apprentissage - CAP 2002, Matthieu Exbrayat, 2002, Orléans, France, 2 p
Communication dans un congrès inria-00100813v1

Proceedings of the Sixth European Workshop on Reinforcement Learning

Alain Dutech , Olivier Buffet
Sixth European Workshop on Reinforcement Learning - EWRL-6, Olivier Buffet, Iadine Chadès, Alain Dutech, Frédérick Garcia, 2003, Nancy, France, 50 p
Communication dans un congrès inria-00099829v1

Coordination through Mutual Notification in Cooperative Multiagent Reinforcement Learning

Daniel Szer , François Charpillet
[Intern report] A04-R-051 || szer04a, 2004, 8 p
Rapport inria-00100215v1

Apprentissage par Renforcement pour la Conception de Systèmes Multi-Agents

Olivier Buffet
[Interne] A02-R-108 || buffet02c, 2002, 29 p
Rapport inria-00100787v1

Etude de différentes combinaisons de comportements adaptatives au sein d'un agent.

Olivier Buffet , Alain Dutech , François Charpillet
[Interne] A03-R-342 || buffet03d, 2003, 40 p
Rapport inria-00099773v1
Image document

Improvements on Learning Tetris with Cross Entropy

Christophe Thiery , Bruno Scherrer
International Computer Games Association Journal, 2009, 32
Article dans une revue inria-00418930v1
Image document

Feature Discovery in Reinforcement Learning using Genetic Programming

Sertan Girgin , Philippe Preux
[Research Report] INRIA. 2007
Rapport inria-00187997v2

Decentralized control in the pursuit domain

Raghav Aras
[Internship report] A03-R-171 || aras03a, 2003, 59 p
Rapport inria-00099539v1
Image document

High-Dimensional Control Using Generalized Auxiliary Tasks

Yannis Flet-Berliac , Philippe Preux
2019
Pré-publication, Document de travail hal-02295705v3
Image document

Select or Suggest? Reinforcement Learning-based Method for High-Accuracy Target Selection on Touchscreens

Zhi Li , Maozheng Zhao , Dibyendu Das , Hang Zhao , Yan Ma , et al.
CHI 2022 - ACM Conference on Human Factors in Computing Systems, Apr 2022, New Orleans, LA, United States. pp.1-15, ⟨10.1145/3491102.3517472⟩
Communication dans un congrès hal-03664185v1
Image document

Toward adaptation in human-robot collaboration

Lorenzo Vianello
Robotics [cs.RO]. Universite de Lorraine, 2022. English. ⟨NNT : 2022LORR0245⟩
Thèse tel-03998070v1
Image document

Learning a Move-Generator for Upper Con dence Trees

Adrien Couetoux , Olivier Teytaud , Hassen Doghmen
International Computer Symposium 2012, Dec 2012, Hualien, Taiwan
Communication dans un congrès hal-00759822v1
Image document

Open-Ended Learning: A Conceptual Framework Based on Representational Redescription

Stéphane Doncieux , David Filliat , Natalia Díaz-Rodríguez , Timothy Hospedales , Richard Duro , et al.
Frontiers in Neurorobotics, 2018, 12, pp.59. ⟨10.3389/fnbot.2018.00059⟩
Article dans une revue hal-01889947v1
Image document

Temporal Difference Learning with Continuous Time and State in the Stochastic Setting

Ziad Kobeissi , Francis Bach
2023
Pré-publication, Document de travail hal-03574645v3

Steering undulatory micro-swimmers in a fluid flow through reinforcement learning

Zakarya El Khiyati , Raphaël Chesneaux , Laëtitia Giraldi , Jérémie Bec
European Physical Journal E: Soft matter and biological physics, 2023, 46 (6), pp.43. ⟨10.1140/epje/s10189-023-00293-8⟩
Article dans une revue hal-04058675v1
Image document

Apprentissage de représentation et auto-organisation modulaire pour un agent autonome

Bruno Scherrer
Interface homme-machine [cs.HC]. Université Henri Poincaré - Nancy I, 2003. Français. ⟨NNT : 2003NAN10018⟩
Thèse tel-00003377v1
Image document

Performance Bounds in $L_p$ norm for Approximate Value Iteration

Rémi Munos
SIAM Journal on Control and Optimization, 2007, 46 (2), pp.541-561. ⟨10.1137/040614384⟩
Article dans une revue inria-00124685v1
Image document

Des agents intelligents dans un environnement de communication multimédia : Vers la conception de services adaptatifs

Romaric Charton
Autre [cs.OH]. Université Henri Poincaré - Nancy I, 2003. Français. ⟨NNT : ⟩
Thèse tel-00004910v1
Image document

Sampling and inference in complex networks

Jithin Kazhuthuveettil Sreedharan
Other [cs.OH]. COMUE Université Côte d'Azur (2015 - 2019), 2016. English. ⟨NNT : 2016AZUR4121⟩
Thèse tel-01485852v1
Image document

The Ecology of Open-Ended Skill Acquisition

Clément Moulin-Frier
Artificial Intelligence [cs.AI]. Université de Bordeaux (UB), 2022
HDR tel-03875448v1
Image document

Multi-Armed Bandit Algorithm for Spatial Reuse in WLANs : Minimizing Stations in Starvation

Anthony Bardou , Thomas Begin , Anthony Busson
23ème congrès annuel de la Société Française de Recherche Opérationnelle et d'Aide à la Décision, ROADEF'22, 2022, Lyon, France
Communication dans un congrès hal-03643750v1
Image document

Basis Expansion in Natural Actor Critic Methods

Sertan Girgin , Philippe Preux
European Workshop on Reinforcement Learning, Jun 2008, Villeneuve d'Ascq, France. pp.110-123
Communication dans un congrès hal-00826055v1
Image document

Scalable Model-Free Algorithms for Influencer Marketing

Alexandra Iacob
Artificial Intelligence [cs.AI]. Université Paris-Saclay, 2023. English. ⟨NNT : 2023UPASG012⟩
Thèse tel-04126471v1