Lawrence Chan

Alıntı yapanlar

	Hepsi	2020 yılından bugüne
Alıntılar	1063	1059
h-endeksi	11	11
i10-endeksi	12	12

580

290

145

435

20202021202220232024202512 26 47 315 565 89

Genel erişim

Tümünü görüntüle

7 makale

0 makale

genel erişime açık olanlar

genel erişime açık olmayanlar

Finansman sağlayan kuruluşun getirdiği zorunluluğa dayalı olarak

Katkıda bulunan yazarlar

Neel NandaMechanistic Interpretability Team Lead, Google DeepMinddeepmind.com üzerinde doğrulanmış e-posta adresine sahip
Anca D DraganAssistant Professor at UC Berkeley // Director, AI Safety and Alignment, Google DeepMindberkeley.edu üzerinde doğrulanmış e-posta adresine sahip
Sören MindermannUniversity of Oxford, OATMLcs.ox.ac.uk üzerinde doğrulanmış e-posta adresine sahip
Buck ShlegerisCEO, Redwood Researchrdwrs.com üzerinde doğrulanmış e-posta adresine sahip
Jacob SteinhardtStanford Universitycs.stanford.edu üzerinde doğrulanmış e-posta adresine sahip
Tom LieberumGoogle DeepMinddeepmind.com üzerinde doğrulanmış e-posta adresine sahip
Bilal ChughtaiIndependentcam.ac.uk üzerinde doğrulanmış e-posta adresine sahip
Richard NgoOpenAIopenai.com üzerinde doğrulanmış e-posta adresine sahip
Lucas Jun Koba SatoModel Evaluation and Threat Research (METR)metr.org üzerinde doğrulanmış e-posta adresine sahip
Brian GoodrichModel Evaluation & Threat Researchevals.alignment.org üzerinde doğrulanmış e-posta adresine sahip
Elizabeth BarnesMETRmetr.org üzerinde doğrulanmış e-posta adresine sahip
Megan KinnimentMETRevals.alignment.org üzerinde doğrulanmış e-posta adresine sahip
Haoxing DuWindBorne Systemsberkeley.edu üzerinde doğrulanmış e-posta adresine sahip
Paul ChristianoNational Institute of Standards and Technologynist.gov üzerinde doğrulanmış e-posta adresine sahip
Nicholas Goldowsky-DillMember of Technical Staff, Redwood Researchrdwrs.com üzerinde doğrulanmış e-posta adresine sahip
Adrià Garriga-AlonsoResearch Scientist, FAR AIfar.ai üzerinde doğrulanmış e-posta adresine sahip
Andrew CritchUC Berkeley, Department of Electrical Engineering and Computer Scienceseecs.berkeley.edu üzerinde doğrulanmış e-posta adresine sahip
Dylan Hadfield-MenellMassachusetts Institute of Technologycsail.mit.edu üzerinde doğrulanmış e-posta adresine sahip
Siddhartha SrinivasaProfessor, University of Washingtoncs.washington.edu üzerinde doğrulanmış e-posta adresine sahip
Adam ScherlisInterpretability Researcher, EleutherAIscherlis.com üzerinde doğrulanmış e-posta adresine sahip

Takip et

Lawrence Chan

PhD Student, UC Berkeley

berkeley.edu üzerinde doğrulanmış e-posta adresine sahip

AI Alignment Interpretability Reward Learning


Başlık Alıntılara göre sırala Yıla göre sırala Başlığa göre sırala	Alıntı yapanlar Alıntı yapanlar	Yıl
Progress measures for grokking via mechanistic interpretability N Nanda, L Chan, T Liberum, J Smith, J Steinhardt ICLR 2023, 2023	372*	2023
The alignment problem from a deep learning perspective R Ngo, L Chan, S Mindermann ICLR 2024, 2022	214*	2022
A toy model of universality: Reverse engineering how networks learn group operations B Chughtai, L Chan, N Nanda ICML 2023, 2023	91	2023
Causal Scrubbing: a method for rigorously testing interpretability hypotheses L Chan, A Garriga-Alonso, N Goldowsky-Dill, R Greenblatt, ... https://www.alignmentforum.org/posts/JvZhhzycHu2Yd57RN/causal-scrubbing-a …, 2022	66	2022
The assistive multi-armed bandit L Chan, D Hadfield-Menell, S Srinivasa, A Dragan 2019 14th ACM/IEEE International Conference on Human-Robot Interaction (HRI …, 2019	57	2019
Adversarial Training for High-Stakes Reliability DM Ziegler, S Nix, L Chan, T Bauman, P Schmidt-Nielsen, T Lin, ... NeurIPS 2022, 2022	55	2022
Evaluating Language-Model Agents on Realistic Autonomous Tasks M Kinniment, LJK Sato, H Du, B Goodrich, M Hasin, L Chan, LH Miles, ... https://evals.alignment.org/Evaluating_LMAs_Realistic_Tasks.pdf, 2023	42	2023
Benefits of assistance over reward learning R Shah, P Freire, N Alex, R Freedman, D Krasheninnikov, L Chan, ...	36	2020
Remote corneal suturing wet lab: microsurgical education during the COVID-19 pandemic ND Pasricha, Z Haq, TR Ahmad, L Chan, TK Redd, GD Seitzman, ... Journal of Cataract & Refractive Surgery 46 (12), 1667-1673, 2020	34	2020
Human irrationality: both bad and good for reward inference L Chan, A Critch, A Dragan arXiv preprint arXiv:2111.06956, 2021	27	2021
Optimal cost design for model predictive control A Jain, L Chan, DS Brown, AD Dragan Learning for Dynamics and Control, 1205-1217, 2021	24	2021
The alignment problem from a deep learning perspective, 2024 R Ngo, L Chan, S Mindermann URL https://arxiv. org/abs/2209.00626, 0	11
Language models are better than humans at next-token prediction B Shlegeris, F Roger, L Chan, E McLean Transactions of Machine Learning Research (TMLR), 2022	9	2022
Mathematical models of computation in superposition K Hänni, J Mendel, D Vaintrob, L Chan arXiv preprint arXiv:2408.05451, 2024	6	2024
Risk factors predicting loss to follow-up, medication noncompliance, and poor visual outcomes among patients with infectious keratitis at a public county hospital JB Lopez, L Chan, M Saifee, S Padmanabhan, M Yung, MF Chan Cornea 42 (9), 1069-1073, 2023	6	2023
Compact proofs of model performance via mechanistic interpretability J Gross, R Agrawal, T Kwa, E Ong, CH Yip, A Gibson, S Noubir, L Chan arXiv preprint arXiv:2406.11779, 2024	4	2024
Minor tobacco alkaloids as biomarkers to distinguish combusted tobacco use from Electronic Nicotine Delivery Systems use. two new analytical methods P Jacob, L Chan, P Cheung, K Bello, L Yu, G StHelen, NL Benowitz Frontiers in Chemistry 10, 749089, 2022	4	2022
Spontaneous hyphema in the setting of COVID-19 pneumonia J Chiang, L Chan, JY Stallworth, MF Chan American Journal of Ophthalmology Case Reports 26, 101447, 2022	2	2022
Re-bench: Evaluating frontier ai r&d capabilities of language model agents against human experts H Wijk, T Lin, J Becker, S Jawhar, N Parikh, T Broadley, L Chan, M Chen, ... arXiv preprint arXiv:2411.15114, 2024	1	2024
Characterization of Polymicrobial and Antibiotic-Resistant Infectious Keratitis in a County Hospital Setting L Chan, JB Lopez, M Saifee, S Padmanabhan, MF Chan, M Yung Cornea open 2 (3), e0016, 2023	1	2023

Sistem, işlemi şu anda gerçekleştiremiyor. Daha sonra yeniden deneyin.

Makaleler 1–20

Yıllık alıntı sayısı

Mükerrer alıntılar

Birleştirilmiş alıntılar

Katkıda bulunan yazar ekleKatkıda bulunan yazarlar

Takip et

Alıntı yapanlar

Katkıda bulunan yazarlar