Xidong Feng

Citée par

	Toutes	Depuis 2020
Citations	616	616
indice h	12	12
indice i10	15	15

340

170

255

2020202120222023202420259 30 69 134 334 39

Accès public

Tout afficher

7 articles

0 article

disponibles

non disponibles

Sur la base des exigences liées au financement

Coauteurs

Yaodong YangBOYA (博雅) Assistant Professor at Peking UniversityAdresse e-mail validée de pku.edu.cn
Jun WangProfessor, Computer Science, University College LondonAdresse e-mail validée de cs.ucl.ac.uk
Stephen McAleerOpenAIAdresse e-mail validée de openai.com
Ying WenAssociate Professor, Shanghai Jiao Tong UniversityAdresse e-mail validée de sjtu.edu.cn
Ziyu WanShanghai Jiao Tong UniversityAdresse e-mail validée de sjtu.edu.cn
Mengyue YangAssistant Professor at University of BristolAdresse e-mail validée de bristol.ac.uk
Jakub Grudzien KubaUC BerkeleyAdresse e-mail validée de berkeley.edu
Yali DuTuring Fellow, Associate professor, King's College LondonAdresse e-mail validée de kcl.ac.uk
Bo Liu (Benjamin Liu)PhD student, National University of Singapore | Prev DeepSeek, Peking UniversityAdresse e-mail validée de comp.nus.edu.sg
Jianming HUAssociate Professor of Department of Automation, Tsinghua UniversityAdresse e-mail validée de mail.tsinghua.edu.cn
Haotian FuBrown UniversityAdresse e-mail validée de brown.edu
Oliver SlumbersUniversity College LondonAdresse e-mail validée de ucl.ac.uk
Hongyao TangMila/UdeMAdresse e-mail validée de mila.quebec

Suivre

Xidong Feng

Google DeepMind

Adresse e-mail validée de google.com - Page d'accueil

Large Language Model Reinforcement Learning Meta Learning Multi-agent Learning


Titre Trier par citations Trier par année Trier par titre	Citée par Citée par	Année
Towards Human-Level Bimanual Dexterous Manipulation with Reinforcement Learning Y Chen, Y Yang, T Wu, S Wang, X Feng, J Jiang, SM McAleer, H Dong, ... NeurIPS 2022, 2022	104	2022
Alphazero-like tree-search can guide large language model decoding and training X Feng, Z Wan, M Wen, SM McAleer, Y Wen, W Zhang, J Wang Forty-first International Conference on Machine Learning, 2024	86	2024
Vehicle trajectory prediction using intention-based conditional variational autoencoder X Feng, Z Cen, J Hu, Y Zhang 2019 IEEE Intelligent Transportation Systems Conference (ITSC), 3514-3519, 2019	67	2019
Heterogeneous-agent mirror learning: A continuum of solutions to cooperative marl JG Kuba, X Feng, S Ding, H Dong, J Wang, Y Yang JMLR, 2022	63*	2022
Towards effective context for meta-reinforcement learning: an approach based on contrastive learning H Fu, H Tang, J Hao, C Chen, X Feng, D Li, W Liu Proceedings of the AAAI Conference on Artificial Intelligence 35 (8), 7457-7465, 2021	53	2021
Neural Auto-Curricula X Feng, O Slumbers, Y Yang, Z Wan, B Liu, S McAleer, Y Wen, J Wang NeurIPS 2021, 2021	52*	2021
ChessGPT: Bridging Policy Learning and Language Modeling X Feng, Y Luo, Z Wang, H Tang, M Yang, K Shao, D Mguni, Y Du, J Wang Advances in Neural Information Processing Systems 36, 2024	41	2024
Mri reconstruction with interpretable pixel-wise operations using reinforcement learning W Li, X Feng, H An, XY Ng, YJ Zhang Proceedings of the AAAI conference on artificial intelligence 34 (01), 792-799, 2020	35	2020
CMML: Contextual modulation meta learning for cold-start recommendation X Feng, C Chen, D Li, M Zhao, J Hao, J Wang Proceedings of the 30th ACM International Conference on Information …, 2021	31	2021
Pangu-agent: A fine-tunable generalist agent with structured reasoning F Christianos, G Papoudakis, M Zimmer, T Coste, Z Wu, J Chen, ... arXiv preprint arXiv:2312.14878, 2023	17	2023
Torchopt: An efficient library for differentiable optimization J Ren, X Feng, B Liu, X Pan, Y Fu, L Mai, Y Yang JMLR Open Source Software, 2022	13	2022
A Theoretical Understanding of Gradient Bias in Meta-Reinforcement Learning X Feng, B Liu, J Ren, L Mai, R Zhu, J Wang, Y Yang NeurIPS 2022, 2021	13*	2021
Contextual Transformer for Offline Meta Reinforcement Learning R Lin, Y Li, X Feng, Z Zhang, XHW Fung, H Zhang, J Wang, Y Du, Y Yang NeurIPS2022 FMDM workshop, 2022	11	2022
Uncertainty of Thoughts: Uncertainty-Aware Planning Enhances Information Seeking in LLMs Z Hu, C Liu, X Feng, Y Zhao, SK Ng, AT Luu, J He, PW Koh, B Hooi The Thirty-eighth Annual Conference on Neural Information Processing Systems, 2024	10*	2024
Autonomous lane change decision making using different deep reinforcement learning methods X Feng, J Hu, Y Huo, Y Zhang CICTP 2019, 5563-5575, 2019	10	2019
Mansa: Learning fast and slow in multi-agent systems DH Mguni, H Chen, T Jafferjee, J Wang, L Yue, X Feng, SM Mcaleer, ... International Conference on Machine Learning, 24631-24658, 2023	6	2023
Natural language reinforcement learning X Feng, Z Wan, H Fu, B Liu, M Yang, GA Koushik, Z Hu, Y Wen, J Wang arXiv preprint arXiv:2411.14251, 2024	2	2024
Efficient Reinforcement Learning with Large Language Model Priors X Yan, Y Song, X Feng, M Yang, H Zhang, HB Ammar, J Wang arXiv preprint arXiv:2410.07927, 2024	2	2024
World Models: Understanding, Modelling and Scaling M Yang, H Li, F Laakom, X Feng, J Shi, Z Li, F Faccio, J Schmidhuber ICLR 2025 Workshop Proposals, 0
Workshop on Reasoning and Planning for Large Language Models Z Hu, Y Zhao, X Feng, MY Kan, N Dziri, Y Du, PW Koh, B Hooi, A Cohan ICLR 2025 Workshop Proposals, 0

Le système ne peut pas réaliser cette opération maintenant. Veuillez réessayer plus tard.

Articles 1–20

Nombre de citations par an

Citations en double

Citations fusionnées

Ajouter les coauteursCoauteurs

Suivre

Citée par

Coauteurs