Muning Wen

引用次数

	总计	2020 年至今
引用	919	919
h 指数	8	8
i10 指数	8	8

540

270

135

405

202120222023202420258 89 247 530 40

开放获取的出版物数量

查看全部

7 篇文章

1 篇文章

可查看的文章

无法查看的文章

根据资助方的强制性开放获取政策

合著作者

Ying WenAssociate Professor, Shanghai Jiao Tong University在 sjtu.edu.cn 的电子邮件经过验证
Jun WangProfessor, Computer Science, University College London在 cs.ucl.ac.uk 的电子邮件经过验证
Weinan ZhangProfessor, Shanghai Jiao Tong University在 sjtu.edu.cn 的电子邮件经过验证
Yaodong YangBOYA (博雅) Assistant Professor at Peking University在 pku.edu.cn 的电子邮件经过验证
Jakub Grudzien KubaUC Berkeley在 berkeley.edu 的电子邮件经过验证
Ziyu WanShanghai Jiao Tong University在 sjtu.edu.cn 的电子邮件经过验证
Haifeng ZhangInstitute of Automation, Chinese Academy of Sciences在 ia.ac.cn 的电子邮件经过验证
Runji LinInstitute of Automation, Chinese Academy of Sciences在 ia.ac.cn 的电子邮件经过验证
Hanjing WangShanghai Jiao Tong University在 sjtu.edu.cn 的电子邮件经过验证
Xidong FengGoogle DeepMind在 google.com 的电子邮件经过验证
Shangding GuUC Berkeley在 eecs.berkeley.edu 的电子邮件经过验证
Ming ZhouResearcher; Shanghai AI Laboratory在 pjlab.org.cn 的电子邮件经过验证
Runzhe WuCornell University在 cornell.edu 的电子邮件经过验证
Ruiwen ZhouShanghai Jiao Tong University在 sjtu.edu.cn 的电子邮件经过验证

关注

Muning Wen

PhD student, Shanghai Jiao Tong University

在 sjtu.edu.cn 的电子邮件经过验证

(multi-agent) reinforcement learning language agent/LLM-based agent


标题按引用次数排序按年份排序按标题排序	引用次数引用次数	年份
Trust region policy optimisation in multi-agent reinforcement learning JG Kuba, R Chen, M Wen, Y Wen, F Sun, J Wang, Y Yang 10th International Conference on Learning Representations, 2021	270	2021
Multi-agent reinforcement learning is a sequence modeling problem M Wen, J Kuba, R Lin, W Zhang, Y Wen, J Wang, Y Yang Advances in Neural Information Processing Systems 35, 16509-16521, 2022	198	2022
Offline pre-trained multi-agent decision transformer L Meng, M Wen, C Le, X Li, D Xing, W Zhang, Y Wen, H Zhang, J Wang, ... Machine Intelligence Research 20 (2), 233-248, 2023	109*	2023
Alphazero-like tree-search can guide large language model decoding and training X Feng, Z Wan, M Wen, Y Wen, W Zhang, J Wang ICML 2024, 2023	82	2023
Settling the variance of multi-agent policy gradients JG Kuba, M Wen, L Meng, H Zhang, D Mguni, J Wang, Y Yang Advances in Neural Information Processing Systems 34, 13458-13470, 2021	70	2021
Malib: A parallel framework for population-based multi-agent reinforcement learning M Zhou, Z Wan, H Wang, M Wen, R Wu, Y Wen, Y Yang, W Zhang, ... JMLR, 2021	59	2021
Multi-agent constrained policy optimisation S Gu, JG Kuba, M Wen, R Chen, Z Wang, Z Tian, J Wang, A Knoll, Y Yang arXiv preprint arXiv:2110.02793, 2021	57	2021
Large sequence models for sequential decision-making: a survey M Wen, R Lin, H Wang, Y Yang, Y Wen, L Mai, J Wang, H Zhang, ... Frontiers of Computer Science 17 (6), 176349, 2023	33	2023
Openr: An open source framework for advanced reasoning with large language models J Wang, M Fang, Z Wan, M Wen, J Zhu, A Liu, Z Gong, Y Song, L Chen, ... arXiv preprint arXiv:2410.09671, 2024	8	2024
Reinforcing LLM Agents via Policy Optimization with Action Decomposition M Wen, Z Wan, J Wang, W Zhang, Y Wen The Thirty-eighth Annual Conference on Neural Information Processing Systems, 2024	7*	2024
Hammer: Robust function-calling for on-device language models via function masking Q Lin, M Wen, Q Peng, G Nie, J Liao, J Wang, X Mo, J Zhou, C Cheng, ... arXiv preprint arXiv:2410.04587, 2024	6	2024
TRAD: Enhancing LLM Agents with Step-Wise Thought Retrieval and Aligned Decision R Zhou, Y Yang, M Wen, Y Wen, W Wang, C Xi, G Xu, Y Yu, W Zhang Proceedings of the 47th International ACM SIGIR Conference on Research and …, 2024	4	2024
Safe Multiagent Learning With Soft Constrained Policy Optimization in Real Robot Control S Gu, D Huang, M Wen, G Chen, A Knoll IEEE Transactions on Industrial Informatics, 2024	4	2024
Entropy-Regularized Token-Level Policy Optimization for Large Language Models M Wen, C Deng, J Wang, W Zhang, Y Wen arXiv preprint arXiv:2402.06700, 2024	4	2024
RoMAT: Role-based multi-agent transformer for generalizable heterogeneous cooperation D Wang, F Zhong, M Wen, M Li, Y Peng, T Li, Y Yang Neural Networks, 106129, 2024	4	2024
Autonomous goal detection and cessation in reinforcement learning: A case study on source term estimation Y Shi, M Wen, Q Zhang, W Zhang, C Liu, W Liu arXiv preprint arXiv:2409.09541, 2024	3	2024
Hammerbench: Fine-grained function-calling evaluation in real mobile device scenarios J Wang, J Zhou, M Wen, X Mo, H Zhang, Q Lin, C Jin, X Wang, W Zhang, ... arXiv preprint arXiv:2412.16516, 2024	1	2024
P3: A Policy-Driven, Pace-Adaptive, and Diversity-Promoted Framework for Optimizing LLM Training Y Yang, H Wang, M Wen, W Zhang arXiv e-prints, arXiv: 2408.05541, 2024		2024
RDHNet: Addressing Rotational and Permutational Symmetries in Continuous Multi-Agent Systems D Wang, L Huang, M Wen, X Teng, T LI, M Li
Open-Ended Learning in General-Sum Games: The Role of Diversity in Correlated Equilibrium Z Zhao, M Wen, Y Wen, Y Yang

系统目前无法执行此操作，请稍后再试。

文章 1–20

每年引用数

重复的引用

合并的引用

添加合著者合著作者

关注

引用次数

合著作者