フォロー
Jihan Yao
Jihan Yao
確認したメール アドレス: uw.edu
タイトル
引用先
引用先
Developing a framework for auditing large language models using human-in-the-loop
M Amirizaniani, J Yao, A Lavergne, ES Okada, A Chadha, T Roosta, ...
arXiv preprint arXiv:2402.09346, 2024
102024
The art of refusal: A survey of abstention in large language models
B Wen, J Yao, S Feng, C Xu, Y Tsvetkov, B Howe, LL Wang
CoRR, 2024
6*2024
POTEC: Off-Policy Learning for Large Action Spaces via Two-Stage Policy Decomposition
Y Saito, J Yao, T Joachims
arXiv preprint arXiv:2402.06151, 2024
42024
Varying Shades of Wrong: Aligning LLMs with Wrong Answers Only
J Yao, W Ding, S Feng, LL Wang, Y Tsvetkov
arXiv preprint arXiv:2410.11055, 2024
2024
現在システムで処理を実行できません。しばらくしてからもう一度お試しください。
論文 1–4