Yang Yue（乐洋）

Citované v

	Všetky	Od 2020
Citácie	86	86
h-index	6	6
i10-index	5	5

20222023202420252 19 48 17

Verejný prístup

všetky položky

2 články

0 článkov

dostupné

nedostupné

Na základe mandátov na financovanie

Spoluautori

Gao Huang （黄高）Associate Professor, Tsinghua UniversityOverená e-mailová adresa na: tsinghua.edu.cn
Bingyi KangResearch Scientist @ TikTokOverená e-mailová adresa na: sea.com
Shuicheng Yan, Fellow of AAAI, ACM,...National University of Singapore, Ex: Skywork AI, Sea AI Lab | Looking for lab membersOverená e-mailová adresa na: nus.edu.sg
Xiao MaResearch Scientist, ByteDance ResearchOverená e-mailová adresa na: bytedance.com
Rui Lu (卢睿)Institute for Interdisciplinary Information Sciences, TsinghuaOverená e-mailová adresa na: mails.tsinghua.edu.cn
Zhongwen XuTencentOverená e-mailová adresa na: tencent.com
Jiashi FengByteDance Inc.Overená e-mailová adresa na: bytedance.com
Andrew ZhaoTsinghua UniversityOverená e-mailová adresa na: mails.tsinghua.edu.cn
Yulin Wang (王语霖)Department of Automation, Tsinghua UniversityOverená e-mailová adresa na: mails.tsinghua.edu.cn
Yizeng HanAlibaba DAMO AcademyOverená e-mailová adresa na: alibaba-inc.com

Sledovať

Yang Yue（乐洋）

Tsinghua University

Overená e-mailová adresa na: mails.tsinghua.edu.cn - Domovská stránka

Reinforcement learning Embodied AI MLLM agent


Názov Zoradiť podľa citácií Zoradiť podľa roka Zoradiť podľa názvu	Citované v Citované v	Rok
Boosting Offline Reinforcement Learning via Data Rebalancing Y Yue, B Kang, X Ma, Z Xu, G Huang, S Yan NeurIPS 2022, offline RL workshop, 2022	18	2022
Decoupled Prioritized Resampling for Offline RL Y Yue, B Kang, X Ma, Q Yang, G Huang, S Song, S Yan IEEE Transactions on Neural Networks and Learning Systems, 2023	16*	2023
How Far is Video Generation from World Model: A Physical Law Perspective B Kang, Y Yue (Equal contribution in alphabetical order), R Lu, Z Lin, ... arXiv preprint arXiv:2411.02385, 2024	12	2024
Understanding, Predicting and Better Resolving Q-Value Divergence in Offline-RL Y Yue, R Lu, B Kang*, S Song, G Huang Neural Information Processing Systems (NeurIPS) 2023, 2023	12	2023
Value-consistent representation learning for data-efficient reinforcement learning Y Yue, B Kang, Z Xu, G Huang, S Yan Proceedings of the AAAI Conference on Artificial Intelligence 37 (9), 11069 …, 2023	11	2023
Improving and benchmarking offline reinforcement learning algorithms B Kang, X Ma, Y Wang, Y Yue, S Yan arXiv preprint arXiv:2306.00972, 2023	7	2023
Model Surgery: Modulating LLM's Behavior Via Simple Parameter Editing H Wang, Y Yue (*Equal contribution), R Lu, J Shi, A Zhao, S Wang, ... North American Chapter of the Association for Computational Linguistics 2025, 2024	5	2024
DeeR-VLA: Dynamic Inference of Multimodal Large Language Models for Efficient Robot Execution Y Yue, Y Wang, B Kang, Y Han, S Wang, S Song, J Feng, G Huang Neural Information Processing Systems (NeurIPS) 2024, 2024	4	2024
LLM-based Optimization of Compound AI Systems: A Survey M Lin, J Sheng, A Zhao, S Wang, Y Yue, Y Wu, H Liu, J Liu, G Huang, ... arXiv preprint arXiv:2410.16392, 2024	1	2024

Systém momentálne nemôže vykonať operáciu. Skúste to neskôr.

Články 1–9

Citácie za rok

Duplicitné citácie

Zlúčené citácie

Pridať spoluautorovSpoluautori

Sledovať

Citované v

Spoluautori