Jiaming Ji (吉嘉铭)

Dikutip oleh

	Semua	Sejak 2020
Kutipan	1893	1891
indeks-h	14	14
indeks-i10	17	17

1600

800

400

1200

202220232024202510 185 1519 172

Akses publik

Lihat semua

8 artikel

0 artikel

tersedia

tidak tersedia

Berdasarkan pada mandat pendanaan

Pengarang bersama

Yaodong YangBOYA (博雅) Assistant Professor at Peking UniversityEmail yang diverifikasi di pku.edu.cn
Xuehai PanPeking UniversityEmail yang diverifikasi di pku.edu.cn
Boyuan ChenPeking UniversityEmail yang diverifikasi di stu.pku.edu.cn
Jiayi ZhouPeking University Ph.D StudentEmail yang diverifikasi di stu.pku.edu.cn
Tianyi (Alex) QiuPeking University, UC BerkeleyEmail yang diverifikasi di berkeley.edu
Hantao LouPeking UniversityEmail yang diverifikasi di stu.pku.edu.cn
Stephen McAleerOpenAIEmail yang diverifikasi di openai.com
Donghai HongPeking UniversityEmail yang diverifikasi di stu.pku.edu.cn
Yiran GengTuring Class, PKU; MITEmail yang diverifikasi di stu.pku.edu.cn
Yuanpei ChenSouth China University of TechnologyEmail yang diverifikasi di stanford.edu

Ikuti

Jiaming Ji (吉嘉铭)

Peking University

Email yang diverifikasi di stu.pku.edu.cn - Beranda

AI Alignment Reinforcement Learning Large Language Model


Judul Urutkan menurut kutipan Urutkan menurut tahun Urutkan menurut judul	Dikutip oleh Dikutip oleh	Tahun
Baichuan 2: Open large-scale language models A Yang, B Xiao, B Wang, B Zhang, C Bian, C Yin, C Lv, D Pan, D Wang, ... arXiv preprint arXiv:2309.10305, 2023	577*	2023
Beavertails: Towards improved safety alignment of llm via a human-preference dataset J Ji, M Liu, J Dai, X Pan, C Zhang, C Bian, R Sun, Y Wang, Y Yang NeurIPS 2023, 2023	308	2023
Safe rlhf: Safe reinforcement learning from human feedback J Dai, X Pan, R Sun, J Ji, X Xu, M Liu, Y Wang, Y Yang The Twelfth International Conference on Learning Representations (Spotlight), 2024	232	2024
Ai alignment: A comprehensive survey J Ji, T Qiu, B Chen, B Zhang, H Lou, K Wang, Y Duan, Z He, J Zhou, ... arXiv preprint arXiv:2310.19852, 2023	226	2023
Bi-dexhands: Towards human-level bimanual dexterous manipulation Y Chen, Y Geng, F Zhong, J Ji, J Jiang, Z Lu, H Dong, Y Yang IEEE Transactions on Pattern Analysis and Machine Intelligence, 2023	126*	2023
Safety-Gymnasium: A Unified Safe Reinforcement Learning Benchmark J Ji, B Zhang, J Zhou, X Pan, W Huang, R Sun, Y Geng, Y Zhong, J Dai, ... NeurIPS 2023, 2023	72*	2023
Aligner: Efficient alignment by learning to correct J Ji, B Chen, H Lou, D Hong, B Zhang, X Pan, T Qiu, J Dai, Y Yang NeurIPS 2024 Oral Presentation, 2024	50*	2024
Constrained update projection approach to safe policy optimization L Yang, J Ji, J Dai, L Zhang, B Zhou, P Li, Y Yang, G Pan NeurIPS 2022, 2023	49	2023
Heterogeneous-Agent Reinforcement Learning Y Zhong, JG Kuba, S Hu, J Ji, Y Yang JMLR, 2023	45	2023
The application of large language models in medicine: A scoping review X Meng, X Yan, K Zhang, D Liu, X Cui, Y Yang, M Zhang, C Cao, J Wang, ... Iscience 27 (5), 2024	44	2024
Omnisafe: An infrastructure for accelerating safe reinforcement learning research J Ji, J Zhou, B Zhang, J Dai, X Pan, R Sun, W Huang, Y Geng, M Liu, ... JMLR 2024, 2023	42	2023
Pku-saferlhf: Towards multi-level safety alignment for llms with human preference J Ji, D Hong, B Zhang, B Chen, J Dai, B Zheng, T Qiu, B Li, Y Yang arXiv preprint arXiv:2406.15513, 2024	23*	2024
Cup: A conservative update policy algorithm for safe reinforcement learning L Yang, J Ji, J Dai, Y Zhang, P Li, G Pan arXiv preprint arXiv:2202.07565, 2022	20	2022
SafeDreamer: Safe Reinforcement Learning with World Models W Huang, J Ji, B Zhang, C Xia, Y Yang ICLR 2024, 2023	15	2023
Augmented proximal policy optimization for safe reinforcement learning J Dai, J Ji, L Yang, Q Zheng, G Pan Proceedings of the AAAI Conference on Artificial Intelligence 37 (6), 7288-7295, 2023	14	2023
VOCE: Variational Optimization with Conservative Estimation for Offline Safe Reinforcement Learning J Guan, G Chen, J Ji, L Yang, A Zhou, Z Li NeurIPS 2023, 2023	11	2023
Pku-beaver: Constrained value-aligned llm via safe rlhf J Dai, X Pan, J Ji, R Sun, Y Wang, Y Yang	11	2023
MyoChallenge 2022: Learning contact-rich manipulation using a musculoskeletal hand V Caggiano, G Durandau, H Wang, A Chiappa, A Mathis, P Tano, N Patel, ... NeurIPS 2022 Competition Track, 233-250, 2023	8	2023
Language Models Resist Alignment J Ji, K Wang, T Qiu, B Chen, J Zhou, C Li, H Lou, Y Yang arXiv preprint arXiv:2406.06144, 2024	5	2024
Reward Generalization in RLHF: A Topological Perspective T Qiu, F Zeng, J Ji, D Yan, K Wang, J Zhou, Y Han, J Dai, X Pan, Y Yang arXiv preprint arXiv:2402.10184, 2024	4	2024

Sistem tidak dapat melakukan operasi ini. Coba lagi nanti.

Artikel 1–20

Kutipan per tahun

Kutipan duplikat

Kutipan yang digabung

Tambahkan pengarang bersamaPengarang bersama

Ikuti

Dikutip oleh

Pengarang bersama