Erik Jenner

Citace

	Všechny	Od 2020
Citace	279	276
h-index	7	7
i10-index	4	4

200

100

150

202220232024202518 39 194 24

Spoluautoři

Adam GleaveCEO at FAR AIE-mailová adresa ověřena na: far.ai
Stuart RussellProfessor of Computer Science, University of California, BerkeleyE-mailová adresa ověřena na: cs.berkeley.edu
Scott EmmonsUC BerkeleyE-mailová adresa ověřena na: berkeley.edu
Maurice WeilerUniversity of AmsterdamE-mailová adresa ověřena na: uva.nl
Joar SkalseDPhil Student in Computer Science, Oxford UniversityE-mailová adresa ověřena na: cs.ox.ac.uk
Shreyas KapurUC BerkeleyE-mailová adresa ověřena na: berkeley.edu
Herke van HoofUniversity of Amsterdam (UVA)E-mailová adresa ověřena na: uva.nl
Fred A. HamprechtProfessor, Heidelberg UniversityE-mailová adresa ověřena na: iwr.uni-heidelberg.de

Sledovat

Erik Jenner

UC Berkeley

E-mailová adresa ověřena na: berkeley.edu - Domovská stránka

Machine Learning Deep Learning AI Safety


Název Seřadit podle citací Seřadit podle roku Seřadit podle názvu	Citace Citace	Rok
Foundational challenges in assuring alignment and safety of large language models U Anwar, A Saparov, J Rando, D Paleka, M Turpin, P Hase, ES Lubana, ... TMLR, 2024	137*	2024
imitation: Clean imitation learning implementations A Gleave, M Taufeeque, J Rocamonde, E Jenner, SH Wang, S Toyer, ... arXiv preprint arXiv:2211.11972, 2022	61	2022
Steerable Partial Differential Operators for Equivariant Neural Networks E Jenner, M Weiler ICLR, 2022	31	2022
Preprocessing Reward Functions for Interpretability E Jenner, A Gleave NeurIPS Cooperative AI workshop, 2021	12	2021
Evidence of Learned Look-Ahead in a Chess-Playing Neural Network E Jenner, S Kapur, V Georgiev, C Allen, S Emmons, S Russell NeurIPS, 2024	7	2024
When Your AI Deceives You: Challenges with Partial Observability of Human Evaluators in Reward Learning L Lang, D Foote, S Russell, A Dragan, E Jenner, S Emmons NeurIPS, 2024	7*	2024
STARC: A General Framework For Quantifying Differences Between Reward Functions J Skalse, L Farnik, SR Motwani, E Jenner, A Gleave, A Abate ICLR, 2023	7	2023
Calculus on MDPs: Potential Shaping as a Gradient E Jenner, H van Hoof, A Gleave arXiv preprint arXiv:2208.09570, 2022	7*	2022
A comparison of causal scrubbing, causal abstractions, and related methods E Jenner, A Garriga-alonso, E Zverev AI Alignment Forum, 2023	4	2023
A general framework for reward function distances E Jenner, JMV Skalse, A Gleave NeurIPS ML Safety Workshop, 2022	4	2022
Diffusion On Syntax Trees For Program Synthesis S Kapur, E Jenner, S Russell arXiv preprint arXiv:2405.20519, 2024	2	2024
Obfuscated Activations Bypass LLM Latent-Space Defenses L Bailey, A Serrano, A Sheshadri, M Seleznyov, J Taylor, E Jenner, ... arXiv preprint arXiv:2412.09565, 2024		2024
Extensions of Karger's Algorithm: Why They Fail in Theory and How They Are Useful in Practice E Jenner, EF Sanmartín, FA Hamprecht Proceedings of the IEEE/CVF International Conference on Computer Vision …, 2021		2021
AI Can Conceal Undesirable Outputs Even Under White-Box Inspection A Draguns, E Jenner
Replication: Fairness without demographics through Adversarially Reweighted Learning E Jenner, T Lieberum, FP Nolte, N Rutsch

Systém momentálně nemůže danou operaci provést. Zkuste to znovu později.

Články 1–15

Citace za rok

Duplicitní citace

Sloučené citace

Přidat spoluautorySpoluautoři

Sledovat

Citace

Spoluautoři