Recherche - INRIA - Institut National de Recherche en Informatique et en Automatique

179 résultats

keyword_s : Reinforcement learning

	Pour les 179 documents Envoyer sur ORCID RSS ATOM Exporter BibTeX XML-TEI CSV RTF EndNote PDF HTML Export avancé	Page : Page précédente 1 2 3 4 5 6 Page suivante	triés par Pertinence Auteur A→Z Auteur Z→A Titre A→Z Titre Z→A Date de publication croissante Date de publication décroissante Date de dépôt croissante Date de dépôt décroissante

		On the Possibility of Learning in Reactive Environments with Arbitrary Dependence Daniil Ryabko , Marcus Hutter Theoretical Computer Science, 2008, 405 (3), pp.274-284. ⟨10.1016/j.tcs.2008.06.039⟩ Article dans une revue hal-00639569v1	Envoyer sur ORCID Exporter BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite Export avancé Partager Gmail Facebook X LinkedIn More
		Apprentissage par renforcement développemental Matthieu Zimmer Intelligence artificielle [cs.AI]. Université de Lorraine, 2018. Français. ⟨NNT : 2018LORR0008⟩ Thèse tel-01735202v1	Envoyer sur ORCID Exporter BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite Export avancé Partager Gmail Facebook X LinkedIn More
		An Autonomic Testing Framework for IPv6 Configuration Protocols Sheila Becker , Humberto Abdelnur , Radu State , Thomas Engel 4th International Conference on Autonomous Infrastructure, Management and Security - AIMS 2010, University of Zurich, Jun 2010, Zurich, Switzerland. pp.65-76, ⟨10.1007/978-3-642-13986-4_7⟩ Communication dans un congrès inria-00546171v1	Envoyer sur ORCID Exporter BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite Export avancé Partager Gmail Facebook X LinkedIn More
		Feature discovery in reinforcement learning using genetic programming Sertan Girgin , Philippe Preux 11th European Conference on Genetic Programming (EUROGP), 2008, Naples, Italy. pp.218-229 Communication dans un congrès hal-00826056v1	Envoyer sur ORCID Exporter BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite Export avancé Partager Gmail Facebook X LinkedIn More
		RISCLESS: A Reinforcement Learning Strategy to Guarantee SLA on Cloud Ephemeral and Stable Resources Sidahmed Yalles , Mohamed Handaoui , Jean-Emile Dartois , Olivier Barais , Laurent d'Orazio , et al. 2022 30th Euromicro International Conference on Parallel, Distributed and Network-Based Processing (PDP), Mar 2022, Valladolid, Spain. pp.83-87, ⟨10.1109/PDP55904.2022.00021⟩ Communication dans un congrès hal-03921309v2	Envoyer sur ORCID Exporter BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite Export avancé Partager Gmail Facebook X LinkedIn More
		Reinforcement Learning for Radio Resource Management of Hybrid-Powered Cellular Networks Hadi Sayed , Ali El Amine , Hussein Al Haj Hassan , Loutfi Nuaymi , Roger Achkar WiMob 2019 : Twelfth International Conference on Wireless and Mobile Computing, Networking and Communications, IEEE, Oct 2019, Barcelona, Spain. ⟨10.1109/WiMOB.2019.8923481⟩ Communication dans un congrès hal-02294149v1	Envoyer sur ORCID Exporter BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite Export avancé Partager Gmail Facebook X LinkedIn More
		Vocal Imitation in Sensorimotor Learning Models: a Comparative Review Silvia Pagliarini , Arthur Leblois , Xavier Hinaut IEEE Transactions on Cognitive and Developmental Systems, 2020, ⟨10.1109/TCDS.2020.3041179⟩ Article dans une revue hal-02317144v2	Envoyer sur ORCID Exporter BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite Export avancé Partager Gmail Facebook X LinkedIn More
		Apprentissage de modèles en télémédecine Laurent Jeanpierre , François Charpillet Conférence Francophone d'Apprentissage - CAP 2002, Matthieu Exbrayat, 2002, Orléans, France, 2 p Communication dans un congrès inria-00100813v1	Envoyer sur ORCID Exporter BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite Export avancé Partager Gmail Facebook X LinkedIn More
		Proceedings of the Sixth European Workshop on Reinforcement Learning Alain Dutech , Olivier Buffet Sixth European Workshop on Reinforcement Learning - EWRL-6, Olivier Buffet, Iadine Chadès, Alain Dutech, Frédérick Garcia, 2003, Nancy, France, 50 p Communication dans un congrès inria-00099829v1	Envoyer sur ORCID Exporter BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite Export avancé Partager Gmail Facebook X LinkedIn More
		Coordination through Mutual Notification in Cooperative Multiagent Reinforcement Learning Daniel Szer , François Charpillet [Intern report] A04-R-051 \|\| szer04a, 2004, 8 p Rapport inria-00100215v1	Envoyer sur ORCID Exporter BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite Export avancé Partager Gmail Facebook X LinkedIn More
		Apprentissage par Renforcement pour la Conception de Systèmes Multi-Agents Olivier Buffet [Interne] A02-R-108 \|\| buffet02c, 2002, 29 p Rapport inria-00100787v1	Envoyer sur ORCID Exporter BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite Export avancé Partager Gmail Facebook X LinkedIn More
		Etude de différentes combinaisons de comportements adaptatives au sein d'un agent. Olivier Buffet , Alain Dutech , François Charpillet [Interne] A03-R-342 \|\| buffet03d, 2003, 40 p Rapport inria-00099773v1	Envoyer sur ORCID Exporter BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite Export avancé Partager Gmail Facebook X LinkedIn More
		Improvements on Learning Tetris with Cross Entropy Christophe Thiery , Bruno Scherrer International Computer Games Association Journal, 2009, 32 Article dans une revue inria-00418930v1	Envoyer sur ORCID Exporter BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite Export avancé Partager Gmail Facebook X LinkedIn More
		Feature Discovery in Reinforcement Learning using Genetic Programming Sertan Girgin , Philippe Preux [Research Report] INRIA. 2007 Rapport inria-00187997v2	Envoyer sur ORCID Exporter BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite Export avancé Partager Gmail Facebook X LinkedIn More
		Decentralized control in the pursuit domain Raghav Aras [Internship report] A03-R-171 \|\| aras03a, 2003, 59 p Rapport inria-00099539v1	Envoyer sur ORCID Exporter BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite Export avancé Partager Gmail Facebook X LinkedIn More
		High-Dimensional Control Using Generalized Auxiliary Tasks Yannis Flet-Berliac , Philippe Preux 2019 Pré-publication, Document de travail hal-02295705v3	Envoyer sur ORCID Exporter BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite Export avancé Partager Gmail Facebook X LinkedIn More
		Select or Suggest? Reinforcement Learning-based Method for High-Accuracy Target Selection on Touchscreens Zhi Li , Maozheng Zhao , Dibyendu Das , Hang Zhao , Yan Ma , et al. CHI 2022 - ACM Conference on Human Factors in Computing Systems, Apr 2022, New Orleans, LA, United States. pp.1-15, ⟨10.1145/3491102.3517472⟩ Communication dans un congrès hal-03664185v1	Envoyer sur ORCID Exporter BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite Export avancé Partager Gmail Facebook X LinkedIn More
		Toward adaptation in human-robot collaboration Lorenzo Vianello Robotics [cs.RO]. Universite de Lorraine, 2022. English. ⟨NNT : 2022LORR0245⟩ Thèse tel-03998070v1	Envoyer sur ORCID Exporter BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite Export avancé Partager Gmail Facebook X LinkedIn More
		Learning a Move-Generator for Upper Con dence Trees Adrien Couetoux , Olivier Teytaud , Hassen Doghmen International Computer Symposium 2012, Dec 2012, Hualien, Taiwan Communication dans un congrès hal-00759822v1	Envoyer sur ORCID Exporter BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite Export avancé Partager Gmail Facebook X LinkedIn More
		Open-Ended Learning: A Conceptual Framework Based on Representational Redescription Stéphane Doncieux , David Filliat , Natalia Díaz-Rodríguez , Timothy Hospedales , Richard Duro , et al. Frontiers in Neurorobotics, 2018, 12, pp.59. ⟨10.3389/fnbot.2018.00059⟩ Article dans une revue hal-01889947v1	Envoyer sur ORCID Exporter BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite Export avancé Partager Gmail Facebook X LinkedIn More
		Temporal Difference Learning with Continuous Time and State in the Stochastic Setting Ziad Kobeissi , Francis Bach 2023 Pré-publication, Document de travail hal-03574645v3	Envoyer sur ORCID Exporter BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite Export avancé Partager Gmail Facebook X LinkedIn More
		Steering undulatory micro-swimmers in a fluid flow through reinforcement learning Zakarya El Khiyati , Raphaël Chesneaux , Laëtitia Giraldi , Jérémie Bec European Physical Journal E: Soft matter and biological physics, 2023, 46 (6), pp.43. ⟨10.1140/epje/s10189-023-00293-8⟩ Article dans une revue hal-04058675v1	Envoyer sur ORCID Exporter BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite Export avancé Partager Gmail Facebook X LinkedIn More
		Apprentissage de représentation et auto-organisation modulaire pour un agent autonome Bruno Scherrer Interface homme-machine [cs.HC]. Université Henri Poincaré - Nancy I, 2003. Français. ⟨NNT : 2003NAN10018⟩ Thèse tel-00003377v1	Envoyer sur ORCID Exporter BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite Export avancé Partager Gmail Facebook X LinkedIn More
		Performance Bounds in $L_p$ norm for Approximate Value Iteration Rémi Munos SIAM Journal on Control and Optimization, 2007, 46 (2), pp.541-561. ⟨10.1137/040614384⟩ Article dans une revue inria-00124685v1	Envoyer sur ORCID Exporter BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite Export avancé Partager Gmail Facebook X LinkedIn More
		Des agents intelligents dans un environnement de communication multimédia : Vers la conception de services adaptatifs Romaric Charton Autre [cs.OH]. Université Henri Poincaré - Nancy I, 2003. Français. ⟨NNT : ⟩ Thèse tel-00004910v1	Envoyer sur ORCID Exporter BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite Export avancé Partager Gmail Facebook X LinkedIn More
		Sampling and inference in complex networks Jithin Kazhuthuveettil Sreedharan Other [cs.OH]. COMUE Université Côte d'Azur (2015 - 2019), 2016. English. ⟨NNT : 2016AZUR4121⟩ Thèse tel-01485852v1	Envoyer sur ORCID Exporter BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite Export avancé Partager Gmail Facebook X LinkedIn More
		The Ecology of Open-Ended Skill Acquisition Clément Moulin-Frier Artificial Intelligence [cs.AI]. Université de Bordeaux (UB), 2022 HDR tel-03875448v1	Envoyer sur ORCID Exporter BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite Export avancé Partager Gmail Facebook X LinkedIn More
		Multi-Armed Bandit Algorithm for Spatial Reuse in WLANs : Minimizing Stations in Starvation Anthony Bardou , Thomas Begin , Anthony Busson 23ème congrès annuel de la Société Française de Recherche Opérationnelle et d'Aide à la Décision, ROADEF'22, 2022, Lyon, France Communication dans un congrès hal-03643750v1	Envoyer sur ORCID Exporter BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite Export avancé Partager Gmail Facebook X LinkedIn More
		Basis Expansion in Natural Actor Critic Methods Sertan Girgin , Philippe Preux European Workshop on Reinforcement Learning, Jun 2008, Villeneuve d'Ascq, France. pp.110-123 Communication dans un congrès hal-00826055v1	Envoyer sur ORCID Exporter BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite Export avancé Partager Gmail Facebook X LinkedIn More
		Scalable Model-Free Algorithms for Influencer Marketing Alexandra Iacob Artificial Intelligence [cs.AI]. Université Paris-Saclay, 2023. English. ⟨NNT : 2023UPASG012⟩ Thèse tel-04126471v1	Envoyer sur ORCID Exporter BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite Export avancé Partager Gmail Facebook X LinkedIn More

Filtrer vos résultats

On the Possibility of Learning in Reactive Environments with Arbitrary Dependence

Apprentissage par renforcement développemental

An Autonomic Testing Framework for IPv6 Configuration Protocols

Feature discovery in reinforcement learning using genetic programming

RISCLESS: A Reinforcement Learning Strategy to Guarantee SLA on Cloud Ephemeral and Stable Resources

Reinforcement Learning for Radio Resource Management of Hybrid-Powered Cellular Networks

Vocal Imitation in Sensorimotor Learning Models: a Comparative Review

Apprentissage de modèles en télémédecine

Proceedings of the Sixth European Workshop on Reinforcement Learning

Coordination through Mutual Notification in Cooperative Multiagent Reinforcement Learning

Apprentissage par Renforcement pour la Conception de Systèmes Multi-Agents

Etude de différentes combinaisons de comportements adaptatives au sein d'un agent.

Improvements on Learning Tetris with Cross Entropy

Feature Discovery in Reinforcement Learning using Genetic Programming

Decentralized control in the pursuit domain

High-Dimensional Control Using Generalized Auxiliary Tasks

Select or Suggest? Reinforcement Learning-based Method for High-Accuracy Target Selection on Touchscreens

Toward adaptation in human-robot collaboration

Learning a Move-Generator for Upper Con dence Trees

Open-Ended Learning: A Conceptual Framework Based on Representational Redescription

Temporal Difference Learning with Continuous Time and State in the Stochastic Setting

Steering undulatory micro-swimmers in a fluid flow through reinforcement learning

Apprentissage de représentation et auto-organisation modulaire pour un agent autonome

Performance Bounds in $L_p$ norm for Approximate Value Iteration

Des agents intelligents dans un environnement de communication multimédia : Vers la conception de services adaptatifs

Sampling and inference in complex networks

The Ecology of Open-Ended Skill Acquisition

Multi-Armed Bandit Algorithm for Spatial Reuse in WLANs : Minimizing Stations in Starvation

Basis Expansion in Natural Actor Critic Methods

Scalable Model-Free Algorithms for Influencer Marketing