Yaodong Yang

인용

	전체	2020년 이후
서지정보	7958	7654
h-index	42	41
i10-index	92	91

3700

1850

925

2775

20172018201920202021202220232024202530 80 175 323 530 908 1614 3667 595

공개 액세스

모두 보기

자료 40개

자료 0개

공개

비공개

재정 지원 요구사항 기준

공동 저자

Jun WangProfessor, Computer Science, University College Londoncs.ucl.ac.uk의 이메일 확인됨
Ying WenAssociate Professor, Shanghai Jiao Tong Universitysjtu.edu.cn의 이메일 확인됨
Jiaming Ji (吉嘉铭)Peking Universitystu.pku.edu.cn의 이메일 확인됨
Weinan ZhangProfessor, Shanghai Jiao Tong Universitysjtu.edu.cn의 이메일 확인됨
Josef DaiZhejiang Universityzju.edu.cn의 이메일 확인됨
David MguniLecturer, Computer Science, Queen Mary University of Londonqmul.ac.uk의 이메일 확인됨
Stephen McAleerOpenAIopenai.com의 이메일 확인됨
Jakub Grudzien KubaUC Berkeleyberkeley.edu의 이메일 확인됨
Yuanpei ChenSouth China University of Technologystanford.edu의 이메일 확인됨
Tianyi (Alex) QiuPeking University, UC Berkeleyberkeley.edu의 이메일 확인됨
Yiran GengTuring Class, PKU; MITstu.pku.edu.cn의 이메일 확인됨
Nicolas Perez-NievesResearch Engineer, DeepMindgoogle.com의 이메일 확인됨
Haitham Bou-AmmarRL-Team Leader, BO-Team Leader, MAS-Team Leader @ Huawei London & H. Assistant Professor @ UCLhuawei.com의 이메일 확인됨
Xiaotie DengChair Professor of Computer Science, Peking University, Beijing, Chinapku.edu.cn의 이메일 확인됨
Jieping Ye, IEEE Fellow & ACM Distin...Alibaba Groupumich.edu의 이메일 확인됨
Matthew E. TaylorProfessor, University of Albertaualberta.ca의 이메일 확인됨

팔로우

Yaodong Yang

BOYA (博雅) Assistant Professor at Peking University

pku.edu.cn의 이메일 확인됨 - 홈페이지

Reinforcement Learning AI Alignment Embodied AI Multi-Agent Learning


제목 서지정보순 정렬 연도순 정렬 제목순 정렬	인용 인용	연도
Mean field multi-agent reinforcement learning Y Yang, R Luo, M Li, M Zhou, W Zhang, J Wang ICML 2018, Long Talk, 5571-5580, 2018	855	2018
Multiagent bidirectionally-coordinated nets: Emergence of human-level coordination in learning to play starcraft combat games P Peng, Y Wen, Y Yang, Q Yuan, Z Tang, H Long, J Wang NeurIPS 2017 Workshop: Emergent Communication, 2017	628	2017
Baichuan 2: Open Large-scale Language Models A Yang, B Xiao, B Wang, B Zhang, C Yin, C Lv, D Pan, D Wang, D Yan, ... arXiv preprint arXiv:2309.10305, 2023	579*	2023
An Overview of Multi-Agent Reinforcement Learning from Game Theoretical Perspective Y Yang, J Wang arXiv preprint arXiv:2011.00583, 2020	351	2020
Efficient Ridesharing Order Dispatching with Mean Field Multi-Agent Reinforcement Learning M Li, Y Jiao, T Qin, Y Yang, Z Gong, J Wang, C Wang, G Wu, J Ye WWW 2019 (oral), 2019	329	2019
Beavertails: Towards improved safety alignment of llm via a human-preference dataset J Ji, M Liu, J Dai, X Pan, C Zhang, C Bian, R Sun, Y Wang, Y Yang NeurIPS 2023, 2023	327	2023
A Review of Safe Reinforcement Learning: Methods, Theory and Applications S Gu, L Yang, Y Du, G Chen, F Walter, J Wang, Y Yang, A Knoll arXiv preprint arXiv:2205.10330, 2022	301	2022
Trust Region Policy Optimisation in Multi-Agent Reinforcement Learning JG Kuba, R Chen, M Wen, Y Wen, F Sun, J Wang, Y Yang ICLR 2022, 2021	273	2021
Safe RLHF: Safe Reinforcement Learning from Human Feedback J Dai, X Pan, R Sun, J Ji, X Xu, M Liu, Y Wang, Y Yang arXiv preprint arXiv:2310.12773, 2023	249	2023
Ai alignment: A comprehensive survey J Ji, T Qiu, B Chen, B Zhang, H Lou, K Wang, Y Duan, Z He, J Zhou, ... arXiv preprint arXiv:2310.19852, 2023	242	2023
SMARTS: Scalable Multi-Agent Reinforcement Learning Training School for Autonomous Driving M Zhou, J Luo, J Villela, Y Yang, D Rusu, J Miao, W Zhang, M Alban, ... Conference on Robotic Learning 2020 (Best System Paper Award), 2020	231*	2020
Multi-Agent Reinforcement Learning is a Sequence Modeling Problem M Wen, JG Kuba, R Lin, W Zhang, Y Wen, J Wang, Y Yang NeurIPS 2022, 2022	206	2022
Probabilistic Recursive Reasoning for Multi-Agent Reinforcement Learning Y Wen, Y Yang, R Luo, J Wang, W Pan ICLR 2019, 2019	183	2019
Can deep learning predict risky retail investors? A case study in financial risk behavior forecasting A Kim, Y Yang, S Lessmann, T Ma, MC Sung, JEV Johnson European Journal of Operational Research 283 (1), 217-234, 2020	127	2020
Offline Pre-trained Multi-agent Decision Transformer L Meng, M Wen, C Le, X Li, D Xing, W Zhang, Y Wen, H Zhang, J Wang, ... Machine Intelligence Research 20 (2), 233-248, 2023	108	2023
Towards Human-Level Bimanual Dexterous Manipulation with Reinforcement Learning Y Chen, Y Yang, T Wu, S Wang, X Feng, J Jiang, SM McAleer, H Dong, ... NeurIPS 2022, 2022	104	2022
Bi-level Actor-Critic for Multi-agent Coordination H Zhang, W Chen, Z Huang, M Li, Y Yang, W Zhang, J Wang AAAI 2020, 2019	104	2019
Multi-Agent Determinantal Q-Learning Y Yang, Y Wen, L Chen, J Wang, K Shao, D Mguni, W Zhang ICML 2020, 2020	87	2020
ProAgent: building proactive cooperative agents with large language models C Zhang, K Yang, S Hu, Z Wang, G Li, Y Sun, C Zhang, Z Zhang, A Liu, ... Proceedings of the AAAI Conference on Artificial Intelligence 38 (16), 17591 …, 2024	83	2024
Jarvis-1: Open-world multi-task agents with memory-augmented multimodal language models Z Wang, S Cai, A Liu, Y Jin, J Hou, B Zhang, H Lin, Z He, Z Zheng, Y Yang, ... IEEE Transactions on Pattern Analysis and Machine Intelligence, 2024	82	2024

현재 시스템이 작동되지 않습니다. 나중에 다시 시도해 주세요.

학술자료 1–20

연간 인용횟수

중복된 서지정보

병합된 서지정보

공동 저자 추가공동 저자

팔로우

인용

공동 저자