Wenzhe Li

Cytowane przez

	Wszystkie	Od 2020
Cytowania	326	326
h-indeks	8	8
i10-indeks	7	7

180

135

202220232024202536 113 166 11

Dostęp publiczny

Wyświetl wszystko

4 artykuły

0 artykułów

dostępne

niedostępne

Objęte finansowaniem

Współautorzy

Chongjie zhangWashington University in St. LouisZweryfikowany adres z wustl.edu
Tianhe YuGoogle DeepMindZweryfikowany adres z google.com
Chelsea FinnStanford University, Physical IntelligenceZweryfikowany adres z cs.stanford.edu
Rui YangUniversity of Illinois Urbana-ChampaignZweryfikowany adres z illinois.edu
Eric JiangPhD Student, EECS, UCBerkeleyZweryfikowany adres z berkeley.edu
Chenlin MengStanford UniversityZweryfikowany adres z stanford.edu
Stefano ErmonStanford UniversityZweryfikowany adres z cs.stanford.edu
Zhe ZengUniversity of California, Los AngelesZweryfikowany adres z cs.ucla.edu
Guy Van den BroeckProfessor and Samueli Fellow, UCLAZweryfikowany adres z cs.ucla.edu
Antonio VergariReader (Associate Professor), University of Edinburgh, UKZweryfikowany adres z ed.ac.uk
Chi JinAssistant Professor, Princeton UniversityZweryfikowany adres z princeton.edu
Yang SongOpenAIZweryfikowany adres z openai.com

Obserwuj

Wenzhe Li

Princeton University

Zweryfikowany adres z princeton.edu - Strona główna


Tytuł Sortuj wg cytatów Sortuj wg roku Sortuj wg tytułu	Cytowane przez Cytowane przez	Rok
Rethinking goal-conditioned supervised learning and its connection to offline rl R Yang, Y Lu, W Li, H Sun, M Fang, Y Du, X Li, L Han, C Zhang arXiv preprint arXiv:2202.04478, 2022	75	2022
A survey on transformers in reinforcement learning W Li, H Luo, Z Lin, C Zhang, Z Lu, D Ye arXiv preprint arXiv:2301.03044, 2023	70	2023
Offline reinforcement learning with reverse model-based imagination J Wang, W Li, H Jiang, G Zhu, S Li, C Zhang Advances in Neural Information Processing Systems 34, 29420-29432, 2021	64	2021
Estimating high order gradients of the data distribution by denoising C Meng, Y Song, W Li, S Ermon Advances in Neural Information Processing Systems 34, 25359-25369, 2021	41	2021
Latent-variable advantage-weighted policy optimization for offline rl X Chen, A Ghadirzadeh, T Yu, Y Gao, J Wang, W Li, B Liang, C Finn, ... arXiv preprint arXiv:2203.08949, 2022	29	2022
Lapo: Latent-variable advantage-weighted policy optimization for offline reinforcement learning X Chen, A Ghadirzadeh, T Yu, J Wang, AY Gao, W Li, L Bin, C Finn, ... Advances in Neural Information Processing Systems 35, 36902-36913, 2022	23	2022
Flow to control: Offline reinforcement learning with lossless primitive discovery Y Yang, H Hu, W Li, S Li, J Yang, Q Zhao, C Zhang Proceedings of the AAAI Conference on Artificial Intelligence 37 (9), 10843 …, 2023	14	2023
Tractable computation of expected kernels W Li, Z Zeng, A Vergari, G Van den Broeck Uncertainty in Artificial Intelligence, 1163-1173, 2021	9	2021
FightLadder: A Benchmark for Competitive Multi-Agent Reinforcement Learning W Li, Z Ding, S Karten, C Jin arXiv preprint arXiv:2406.02081, 2024	1	2024
Rethinking Mixture-of-Agents: Is Mixing Different Large Language Models Beneficial? W Li, Y Lin, M Xia, C Jin arXiv preprint arXiv:2502.00674, 2025		2025
Towards Principled Superhuman AI for Multiplayer Symmetric Games J Ge, Y Wang, W Li, C Jin arXiv preprint arXiv:2406.04201, 2024		2024

Nie można teraz wykonać tej operacji. Spróbuj ponownie później.

Prace 1–11

Cytowania rocznie

Powielone cytowania

Scalone cytowania

Dodaj współautorówWspółautorzy

Obserwuj

Cytowane przez

Współautorzy