‪Aidan O'Gara‬ - ‪Academic Search‬

Skapa en profil

Citeras av

	Alla	Sedan 2020
Citat	473	473
h-index	6	6
i10-index	4	4

0

360

180

90

270

20232024202540 356 74

Aidan O'Gara

Aidan O'Gara

University of Southern California

Verifierad e-postadress på usc.edu

Machine Learning AI Safety


Titel Sortera efter citat Sortera efter år Sortera efter titel	Citeras av Citeras av	År
Ai alignment: A comprehensive survey J Ji, T Qiu, B Chen, B Zhang, H Lou, K Wang, Y Duan, Z He, J Zhou, ... arXiv preprint arXiv:2310.19852, 2023	245	2023
AI deception: A survey of examples, risks, and potential solutions PS Park, S Goldstein, A O’Gara, M Chen, D Hendrycks Patterns 5 (5), 2024	176	2024
Hoodwinked: Deception and cooperation in a text-based game for language models A O'Gara arXiv preprint arXiv:2308.01404, 2023	26	2023
AI deception: A survey of examples, risks, and potential solutions. arXiv PS Park, S Goldstein, A O’Gara, M Chen, D Hendrycks arXiv preprint arXiv:2308.14752, 2023	10	2023
Open problems in machine unlearning for ai safety F Barez, T Fu, A Prabhu, S Casper, A Sanyal, A Bibi, A O'Gara, R Kirk, ... arXiv preprint arXiv:2501.04952, 2025	8	2025
Ai alignment: A comprehensive survey. arXiv J Ji, T Qiu, B Chen, B Zhang, H Lou, K Wang, Y Duan, Z He, J Zhou, ... arXiv preprint arXiv:2310.19852, 2023	8	2023
Robustness Evaluation of Proxy Models against Adversarial Optimization A Zou, L Phan, N Li, JS Chan, M Mazeika, A O'Gara, S Basart, J Ng, ...

Systemet kan inte utföra åtgärden just nu. Försök igen senare.

Artiklar 1–7