Yaodong Yang

Citée par

	Toutes	Depuis 2020
Citations	7678	7377
indice h	42	41
indice i10	91	90

3700

1850

925

2775

20172018201920202021202220232024202530 82 173 322 556 908 1552 3692 334

Accès public

Tout afficher

40 articles

0 article

disponibles

non disponibles

Sur la base des exigences liées au financement

Coauteurs

Jun WangProfessor, Computer Science, University College LondonAdresse e-mail validée de cs.ucl.ac.uk
Ying WenAssociate Professor, Shanghai Jiao Tong UniversityAdresse e-mail validée de sjtu.edu.cn
Jiaming Ji (吉嘉铭)Peking UniversityAdresse e-mail validée de stu.pku.edu.cn
Weinan ZhangProfessor, Shanghai Jiao Tong UniversityAdresse e-mail validée de sjtu.edu.cn
Josef DaiZhejiang UniversityAdresse e-mail validée de zju.edu.cn
David MguniLecturer, Computer Science, Queen Mary University of LondonAdresse e-mail validée de qmul.ac.uk
Stephen McAleerOpenAIAdresse e-mail validée de openai.com
Jakub Grudzien KubaUC BerkeleyAdresse e-mail validée de berkeley.edu
Yuanpei ChenSouth China University of TechnologyAdresse e-mail validée de stanford.edu
Yiran GengTuring Class, PKU; MITAdresse e-mail validée de stu.pku.edu.cn
Tianyi (Alex) QiuPeking University, UC BerkeleyAdresse e-mail validée de berkeley.edu
Nicolas Perez-NievesResearch Engineer, DeepMindAdresse e-mail validée de google.com
Haitham Bou-AmmarRL-Team Leader, BO-Team Leader, MAS-Team Leader @ Huawei London & H. Assistant Professor @ UCLAdresse e-mail validée de huawei.com
Xiaotie DengChair Professor of Computer Science, Peking University, Beijing, ChinaAdresse e-mail validée de pku.edu.cn
Jieping Ye, IEEE Fellow & ACM Distin...Alibaba GroupAdresse e-mail validée de umich.edu
Matthew E. TaylorProfessor, University of AlbertaAdresse e-mail validée de ualberta.ca

Suivre

Yaodong Yang

BOYA (博雅) Assistant Professor at Peking University

Adresse e-mail validée de pku.edu.cn - Page d'accueil

Reinforcement Learning AI Alignment Embodied AI Multi-Agent Learning


Titre Trier par citations Trier par année Trier par titre	Citée par Citée par	Année
Mean field multi-agent reinforcement learning Y Yang, R Luo, M Li, M Zhou, W Zhang, J Wang ICML 2018, Long Talk, 5571-5580, 2018	848	2018
Multiagent bidirectionally-coordinated nets: Emergence of human-level coordination in learning to play starcraft combat games P Peng, Y Wen, Y Yang, Q Yuan, Z Tang, H Long, J Wang NeurIPS 2017 Workshop: Emergent Communication, 2017	624	2017
Baichuan 2: Open Large-scale Language Models A Yang, B Xiao, B Wang, B Zhang, C Yin, C Lv, D Pan, D Wang, D Yan, ... arXiv preprint arXiv:2309.10305, 2023	572*	2023
An Overview of Multi-Agent Reinforcement Learning from Game Theoretical Perspective Y Yang, J Wang arXiv preprint arXiv:2011.00583, 2020	351	2020
Efficient Ridesharing Order Dispatching with Mean Field Multi-Agent Reinforcement Learning M Li, Y Jiao, T Qin, Y Yang, Z Gong, J Wang, C Wang, G Wu, J Ye WWW 2019 (oral), 2019	316	2019
Beavertails: Towards improved safety alignment of llm via a human-preference dataset J Ji, M Liu, J Dai, X Pan, C Zhang, C Bian, R Sun, Y Wang, Y Yang NeurIPS 2023, 2023	306	2023
A Review of Safe Reinforcement Learning: Methods, Theory and Applications S Gu, L Yang, Y Du, G Chen, F Walter, J Wang, Y Yang, A Knoll arXiv preprint arXiv:2205.10330, 2022	298	2022
Trust Region Policy Optimisation in Multi-Agent Reinforcement Learning JG Kuba, R Chen, M Wen, Y Wen, F Sun, J Wang, Y Yang ICLR 2022, 2021	270	2021
Safe RLHF: Safe Reinforcement Learning from Human Feedback J Dai, X Pan, R Sun, J Ji, X Xu, M Liu, Y Wang, Y Yang arXiv preprint arXiv:2310.12773, 2023	224	2023
SMARTS: Scalable Multi-Agent Reinforcement Learning Training School for Autonomous Driving M Zhou, J Luo, J Villela, Y Yang, D Rusu, J Miao, W Zhang, M Alban, ... Conference on Robotic Learning 2020 (Best System Paper Award), 2020	223*	2020
Ai alignment: A comprehensive survey J Ji, T Qiu, B Chen, B Zhang, H Lou, K Wang, Y Duan, Z He, J Zhou, ... arXiv preprint arXiv:2310.19852, 2023	222	2023
Multi-Agent Reinforcement Learning is a Sequence Modeling Problem M Wen, JG Kuba, R Lin, W Zhang, Y Wen, J Wang, Y Yang NeurIPS 2022, 2022	198	2022
Probabilistic Recursive Reasoning for Multi-Agent Reinforcement Learning Y Wen, Y Yang, R Luo, J Wang, W Pan ICLR 2019, 2019	180	2019
Can deep learning predict risky retail investors? A case study in financial risk behavior forecasting A Kim, Y Yang, S Lessmann, T Ma, MC Sung, JEV Johnson European Journal of Operational Research 283 (1), 217-234, 2020	132	2020
Bi-level Actor-Critic for Multi-agent Coordination H Zhang, W Chen, Z Huang, M Li, Y Yang, W Zhang, J Wang AAAI 2020, 2019	105	2019
Towards Human-Level Bimanual Dexterous Manipulation with Reinforcement Learning Y Chen, Y Yang, T Wu, S Wang, X Feng, J Jiang, SM McAleer, H Dong, ... NeurIPS 2022, 2022	103	2022
Multi-Agent Determinantal Q-Learning Y Yang, Y Wen, L Chen, J Wang, K Shao, D Mguni, W Zhang ICML 2020, 2020	86	2020
Factorized Q-learning for large-scale multi-agent systems M Zhou, Y Chen, Y Wen, Y Yang, Y Su, W Zhang, D Zhang, J Wang International Conference on Distributed Artificial Intelligence, 1-7, 2019	83	2019
Jarvis-1: Open-world multi-task agents with memory-augmented multimodal language models Z Wang, S Cai, A Liu, Y Jin, J Hou, B Zhang, H Lin, Z He, Z Zheng, Y Yang, ... IEEE Transactions on Pattern Analysis and Machine Intelligence, 2024	78	2024
Offline Pre-trained Multi-agent Decision Transformer L Meng, M Wen, C Le, X Li, D Xing, W Zhang, Y Wen, H Zhang, J Wang, ... Machine Intelligence Research 20 (2), 233-248, 2023	76	2023

Le système ne peut pas réaliser cette opération maintenant. Veuillez réessayer plus tard.

Articles 1–20

Nombre de citations par an

Citations en double

Citations fusionnées

Ajouter les coauteursCoauteurs

Suivre

Citée par

Coauteurs