Samuele Tosatto

Citata da

	Tutte	Dal 2019
Citazioni	209	200
Indice H	7	7
i10-index	5	5

20182019202020212022202320248 17 24 29 46 42 42

Accesso pubblico

Visualizza tutto

5 articoli

0 articoli

Disponibili

Non disponibili

In base ai mandati di finanziamento

Coautori

Jan PetersProfessor for Intelligent Autonomous Systems/TU Darmstadt, Dept. Head/German AI Research Center DFKIEmail verificata su ias.tu-darmstadt.de
A. Rupam MahmoodUniversity of Alberta, AmiiEmail verificata su ualberta.ca
Carlo D'EramoProfessor of Reinforcement Learning @ University of Würzburg | Group leader @ TU DarmstadtEmail verificata su uni-wuerzburg.de
Marcello RestelliAssociate Professor, Politecnico di MilanoEmail verificata su polimi.it
Univ.-Prof. Dr. Elmar RueckertChair of Cyber-Physical-Systems at Montanuniversität LeobenEmail verificata su ai-lab.science
Matteo PirottaResearch Scientist, Meta (FAIR)Email verificata su fb.com
Martin JagersandUniversity of AlbertaEmail verificata su cs.ualberta.ca
Joni PajarinenAssociate Professor at Aalto UniversityEmail verificata su aalto.fi
Georgia ChalvatzakiProfessor for Interactive Robot Perception and Learning, Technische Universität DarmstadtEmail verificata su tu-darmstadt.de
João CarvalhoTechnische Universität DarmstadtEmail verificata su ias.informatik.tu-darmstadt.de
Hany AbdulsamadPostdoc, Aalto UniversityEmail verificata su aalto.fi
Riad AkrourInria ScoolEmail verificata su inria.fr
Andrew PattersonUniversity of AlbertaEmail verificata su ualberta.ca
Martha WhiteUniversity of AlbertaEmail verificata su ualberta.ca

Segui

Samuele Tosatto

Assistant Professor @ Universität Innsbruck

Email verificata su uibk.ac.at - Home page

Robot Learning Reinforcement Learning Machine Learning


Titolo Ordina per citazioni Ordina per anno Ordina per titolo	Citata da Citata da	Anno
Learning inverse dynamics models in o (n) time with lstm networks E Rueckert, M Nakatenus, S Tosatto, J Peters 2017 IEEE-RAS 17th International Conference on Humanoid Robotics (Humanoids …, 2017	82	2017
Boosted Fitted Q-Iteration S Tosatto, DE Carlo, P Matteo, R Marcello International Conference of Machine Learning, 2017	48	2017
Contextual latent-movements off-policy optimization for robotic manipulation skills S Tosatto, G Chalvatzaki, J Peters 2021 IEEE international conference on robotics and automation (ICRA), 10815 …, 2021	17	2021
A Nonparametric Off-Policy Policy Gradient S Tosatto, J Carvalho, H Abdulsamad, J Peters International Conference on Artificial Intelligence and Statistics (AISTATS), 2020	14	2020
Model-free Policy Learning with Reward Gradients Q Lan, S Tosatto, H Farrahi, A Mahmood arXiv preprint arXiv:2103.05147, 2021	10	2021
Dynamic Decision Frequency with Continuous Options A Karimi, J Jin, J Luo, AR Mahmood, M Jagersand, S Tosatto 2023 IEEE/RSJ International Conference on Intelligent Robots and Systems …, 2023	8	2023
Exploration Driven By an Optimistic Bellman Equation S Tosatto, C D'Eramo, J Pajarinen, M Restelli, J Peters International Joint Conference on Neural Networks, 2019	7	2019
An alternate policy gradient estimator for softmax policies S Garg, S Tosatto, Y Pan, M White, AR Mahmood arXiv preprint arXiv:2112.11622, 2021	6	2021
Batch reinforcement learning with a nonparametric off-policy policy gradient S Tosatto, J Carvalho, J Peters IEEE Transactions on Pattern Analysis and Machine Intelligence 44 (10), 5996 …, 2021	5	2021
An upper bound of the bias of Nadaraya-Watson kernel regression under Lipschitz assumptions S Tosatto, R Akrour, J Peters Stats 4 (1), 1-17, 2020	5	2020
Deep probabilistic movement primitives with a bayesian aggregator M Przystupa, F Haghverd, M Jagersand, S Tosatto 2023 IEEE/RSJ International Conference on Intelligent Robots and Systems …, 2023	3	2023
A temporal-difference approach to policy gradient estimation S Tosatto, A Patterson, M White, R Mahmood International Conference on Machine Learning, 21609-21632, 2022	2	2022
A Gradient Critic for Policy Gradient Estimation S Tosatto, A Patterson, M White, AR Mahmood Sixteenth European Workshop on Reinforcement Learning, 2023	1	2023
Dimensionality Reduction of Movement Primitives in Parameter Space S Tosatto, J Stadtmüller, J Peters arXiv preprint arXiv:2003.02634, 2020	1	2020
Variable-Decision Frequency Option Critic. A Karimi, J Jin, J Luo, AR Mahmood, M Jägersand, S Tosatto CoRR, 2022		2022
Off-Policy Reinforcement Learning for Robotics S Tosatto Technische Universität Darmstadt, 2021		2021
An Upper Bound of the Bias of Nadaraya-Watson Kernel Regression under Lipschitz Assumptions. Stats 2021, 4, 1–17 S Tosatto, R Akrour, J Peters s Note: MDPI stays neu-tral with regard to jurisdictional clai-ms in …, 2020		2020
Technical Report:“Exploration Driven by an Optimistic Bellman Equation” S Tosatto, C D’Eramo, J Pajarinen, M Restelli, J Peters		2018
Revisiting On-Policy Deep Reinforcement Learning M Kallel, S Tosatto, C D’Eramo
Pink Noise LQR: How does Colored Noise affect the Optimal Policy in RL? J Hollenstein, M Zaric, S Tosatto, J Piater ICML 2024 Workshop: Foundations of Reinforcement Learning and Control …, 0

Il sistema al momento non può eseguire l'operazione. Riprova più tardi.

Articoli 1–20

Citazioni per anno

Citazioni duplicate

Citazioni unite

Aggiungi coautoriCoautori

Segui

Citata da

Coautori