‪Zikang Shan‬ - ‫محقق Google‬

دریافت نمایه من

نقل شده توسط

	همهٔ موارد	از 2020
نقل‌‏قول‌‏ها	205	205
شاخص h	3	3
شاخص i10	3	3

0

180

90

45

135

20232024202520 166 19

دنبال کردن

Zikang Shan

Zikang Shan

Peking University

ایمیل تأیید شده در stu.pku.edu.cn - صفحهٔ اصلی

Reinforcement Learning


عنوان به‌ترتیب نقل قول‌ها به‌ترتیب سال به‌ترتیب عنوان	نقل شده توسط نقل شده توسط	سال
Unidexgrasp: Universal robotic dexterous grasping via learning diverse proposal generation and goal-conditioned policy‏ Y Xu, W Wan, J Zhang, H Liu, Z Shan, H Shen, R Wang, H Geng, Y Weng, ...‏ Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern …, 2023‏	95	2023
Unidexgrasp++: Improving dexterous grasping policy learning via geometry-aware curriculum and iterative generalist-specialist learning‏ W Wan, H Geng, Y Liu, Z Shan, Y Yang, L Yi, H Wang‏ Proceedings of the IEEE/CVF International Conference on Computer Vision …, 2023‏	73	2023
Dpo meets ppo: Reinforced token optimization for rlhf‏ H Zhong, Z Shan, G Feng, W Xiong, X Cheng, L Zhao, D He, J Bian, ...‏ arXiv preprint arXiv:2404.18922, 2024‏	37	2024

سیستم در حال حاضر قادر به انجام عملکرد نیست. بعداً دوباره امتحان کنید.

مقاله‌ها 1–3