Catherine Olsson

引用次数

	总计	2020 年至今
引用	20069	14889
h 指数	26	26
i10 指数	28	27

6000

3000

1500

4500

20142015201620172018201920202021202220232024202574 152 790 1072 1304 1461 1616 1806 1895 3377 5553 625

开放获取的出版物数量

查看全部

2 篇文章

0 篇文章

可查看的文章

无法查看的文章

根据资助方的强制性开放获取政策

合著作者

Tuan-Hung VuSenior Research Scientist, valeo.ai在 valeo.com 的电子邮件经过验证
Ivan LaptevProfessor at MBZUAI, on leave from INRIA在 inria.fr 的电子邮件经过验证
Josef SivicCzech Technical University, CIIRC, ELLIS Unit Prague在 cvut.cz 的电子邮件经过验证
Aude OlivaSenior Research Scientist, CSAIL, MIT Director MIT-IBM Lab, MIT College Director Industry在 mit.edu 的电子邮件经过验证

关注

Catherine Olsson

Anthropic

在 mit.edu 的电子邮件经过验证

Machine Learning


标题按引用次数排序按年份排序按标题排序	引用次数引用次数	年份
Estimating the reproducibility of psychological science Open Science Collaboration Science 349 (6251), aac4716, 2015	10007	2015
Dota 2 with large scale deep reinforcement learning C Berner, G Brockman, B Chan, V Cheung, P Dębiak, C Dennison, ... arXiv preprint arXiv:1912.06680, 2019	2109	2019
Training a helpful and harmless assistant with reinforcement learning from human feedback Y Bai, A Jones, K Ndousse, A Askell, A Chen, N DasSarma, D Drain, ... arXiv preprint arXiv:2204.05862, 2022	1671	2022
Constitutional ai: Harmlessness from ai feedback Y Bai, S Kadavath, S Kundu, A Askell, J Kernion, A Jones, A Chen, ... arXiv preprint arXiv:2212.08073, 2022	1294	2022
An open, large-scale, collaborative effort to estimate the reproducibility of psychological science Open Science Collaboration Perspectives on Psychological Science 7, 657-660, 2012	774	2012
Red teaming language models to reduce harms: Methods, scaling behaviors, and lessons learned D Ganguli, L Lovitt, J Kernion, A Askell, Y Bai, S Kadavath, B Mann, ... arXiv preprint arXiv:2209.07858, 2022	479	2022
Tensorfuzz: Debugging neural networks with coverage-guided fuzzing A Odena, C Olsson, D Andersen, I Goodfellow International Conference on Machine Learning, 4901-4911, 2019	405	2019
A general language assistant as a laboratory for alignment A Askell, Y Bai, A Chen, D Drain, D Ganguli, T Henighan, A Jones, ... arXiv preprint arXiv:2112.00861, 2021	394	2021
In-context learning and induction heads C Olsson, N Elhage, N Nanda, N Joseph, N DasSarma, T Henighan, ... arXiv preprint arXiv:2209.11895, 2022	390	2022
A mathematical framework for transformer circuits N Elhage, N Nanda, C Olsson, T Henighan, N Joseph, B Mann, A Askell, ... Transformer Circuits Thread 1 (1), 12, 2021	336	2021
Toy models of superposition N Elhage, T Hume, C Olsson, N Schiefer, T Henighan, S Kravec, ... arXiv preprint arXiv:2209.10652, 2022	315	2022
Predictability and surprise in large generative models D Ganguli, D Hernandez, L Lovitt, A Askell, Y Bai, A Chen, T Conerly, ... Proceedings of the 2022 ACM Conference on Fairness, Accountability, and …, 2022	298	2022
Discovering language model behaviors with model-written evaluations E Perez, S Ringer, K Lukošiūtė, K Nguyen, E Chen, S Heiner, C Pettit, ... arXiv preprint arXiv:2212.09251, 2022	249	2022
Language models (mostly) know what they know S Kadavath, T Conerly, A Askell, T Henighan, D Drain, E Perez, ... arXiv preprint arXiv:2207.05221, 2022	182	2022
Discriminator rejection sampling S Azadi, C Olsson, T Darrell, I Goodfellow, A Odena arXiv preprint arXiv:1810.06758, 2018	163	2018
The capacity for moral self-correction in large language models D Ganguli, A Askell, N Schiefer, TI Liao, K Lukošiūtė, A Chen, A Goldie, ... arXiv preprint arXiv:2302.07459, 2023	149	2023
Is generator conditioning causally related to GAN performance? A Odena, J Buckman, C Olsson, T Brown, C Olah, C Raffel, I Goodfellow International conference on machine learning, 3849-3858, 2018	146	2018
Dota 2 with large scale deep reinforcement learning CB OpenAI, G Brockman, B Chan, V Cheung, P Debiak, C Dennison, ... arXiv preprint arXiv:1912.06680 2, 2019	124	2019
Unrestricted adversarial examples TB Brown, N Carlini, C Zhang, C Olsson, P Christiano, I Goodfellow arXiv preprint arXiv:1809.08352, 2018	115	2018
A mathematical framework for transformer circuits. Transformer Circuits Thread, 2021 N Elhage, N Nanda, C Olsson, T Henighan, N Joseph, B Mann, A Askell, ...	80

系统目前无法执行此操作，请稍后再试。

文章 1–20

每年引用数

重复的引用

合并的引用

添加合著者合著作者

关注

引用次数

合著作者