Robert Kirk

Citata da

	Tutte	Dal 2019
Citazioni	413	413
Indice H	6	6
i10-index	6	6

200

100

150

20212022202320248 124 193 85

Coautori

Edward GrefenstetteDirector of Research, Google DeepMind | Honorary Professor, UCLEmail verificata su google.com
Tim RocktäschelProfessor of Artificial Intelligence at UCL, Open-Endedness Team Lead at Google DeepMindEmail verificata su cs.ucl.ac.uk
Amy ZhangAssistant Professor of Electrical and Computer Engineering at University of Texas at AustinEmail verificata su austin.utexas.edu
Eric HambroAnthropicEmail verificata su anthropic.com
David Scott KruegerUniversity Assistant Professor, University of CambridgeEmail verificata su cam.ac.uk
Minqi JiangResearch Scientist at Google DeepMindEmail verificata su ucl.ac.uk
Roberta RaileanuResearch Scientist, MetaEmail verificata su fb.com
Vitaly KurinResearch Scientist at Isomorphic LabsEmail verificata su isomorphiclabs.com
Mikayel SamvelyanMeta AI & UCLEmail verificata su meta.com
Fabio PetroniSamaya AIEmail verificata su samaya.ai
Heinrich KüttlerInflection AIEmail verificata su math.lmu.de
Jack Parker-HolderGoogle DeepMind, UCLEmail verificata su google.com
Ekdeep Singh LubanaUniversity of MichiganEmail verificata su umich.edu
Usman AnwarUniversity of CambridgeEmail verificata su cam.ac.uk
Hidenori TanakaGroup Leader, NTT Research at Harvard UniversityEmail verificata su fas.harvard.edu
Robert DickUniversity of Michigan, StrydEmail verificata su rpdmail.dyndns.org
Samyak JainUndergrad at Indian Institute of Technology(BHU),VaranasiEmail verificata su itbhu.ac.in
Thomas CosteNoah's Ark Lab & University of CambridgeEmail verificata su cam.ac.uk
Christoforos NalmpantisPostdoctoral Researcher, Fundamental AI Research at MetaEmail verificata su fb.com
Jelena LuketinaOxford UniversityEmail verificata su cs.ox.ac.uk

Segui

Robert Kirk

PhD Student, University College London

Email verificata su ucl.ac.uk - Home page

AI Alignment AI Safety Language Models Fine-tuning Generalisation


Titolo Ordina per citazioni Ordina per anno Ordina per titolo	Citata da Citata da	Anno
A survey of zero-shot generalisation in deep reinforcement learning R Kirk, A Zhang, E Grefenstette, T Rocktäschel Journal of Artificial Intelligence Research 76, 201-264, 2023	266*	2023
Minihack the planet: A sandbox for open-ended reinforcement learning research M Samvelyan, R Kirk, V Kurin, J Parker-Holder, M Jiang, E Hambro, ... arXiv preprint arXiv:2109.13202, 2021	69	2021
Reward model ensembles help mitigate overoptimization T Coste, U Anwar, R Kirk, D Krueger arXiv preprint arXiv:2310.02743, 2023	17	2023
Insights from the neurips 2021 nethack challenge E Hambro, S Mohanty, D Babaev, M Byeon, D Chakraborty, ... NeurIPS 2021 Competitions and Demonstrations Track, 41-52, 2022	17	2022
Understanding the effects of rlhf on llm generalisation and diversity R Kirk, I Mediratta, C Nalmpantis, J Luketina, E Hambro, E Grefenstette, ... arXiv preprint arXiv:2310.06452, 2023	16	2023
Mechanistically analyzing the effects of fine-tuning on procedurally defined tasks S Jain, R Kirk, ES Lubana, RP Dick, H Tanaka, E Grefenstette, ... arXiv preprint arXiv:2311.12786, 2023	14	2023
Generalization to new sequential decision making tasks with in-context learning SC Raparthy, E Hambro, R Kirk, M Henaff, R Raileanu arXiv preprint arXiv:2312.03801, 2023	4	2023
Graph backup: Data efficient backup exploiting markovian transitions Z Jiang, T Zhang, R Kirk, T Rocktäschel, E Grefenstette arXiv preprint arXiv:2205.15824, 2022	4*	2022
A study of off-policy learning in environments with procedural content generation A Ehrenberg, R Kirk, M Jiang, E Grefenstette, T Rocktäschel ICLR Workshop on Agent Learning in Open-Endedness, 2022	4	2022
Leading the Pack: N-player Opponent Shaping A Souly, T Willi, A Khan, R Kirk, C Lu, E Grefenstette, T Rocktäschel arXiv preprint arXiv:2312.12564, 2023	1	2023
Domain Generalization for Robust Model-Based Offline Reinforcement Learning A Clark, SA Siddiqui, R Kirk, U Anwar, S Chung, D Krueger arXiv preprint arXiv:2211.14827, 2022	1	2022
What Mechanisms Does Knowledge Distillation Distill? C Wu, ES Lubana, BK Mlodozeniec, R Kirk, D Krueger UniReps: the First Workshop on Unifying Representations in Neural Models, 2023		2023

Il sistema al momento non può eseguire l'operazione. Riprova più tardi.

Articoli 1–12

Citazioni per anno

Citazioni duplicate

Citazioni unite

Aggiungi coautoriCoautori

Segui

Citata da

Coautori