Yifan Du

צוטט על ידי

	הכל	מאז 2020
ציטוטים ביבליוגרפיים	5531	5524
H-index	7	7
i10-index	5	5

3800

1900

950

2850

202220232024202532 998 3777 700

מחברים משותפים

Wayne Xin ZhaoProfessor, Renmin University of Chinaכתובת אימייל מאומתת בדומיין ruc.edu.cn
Ji-Rong WenRenmin University of Chinaכתובת אימייל מאומתת בדומיין ruc.edu.cn
Kun ZhouUCSD Postdoctoral Researcherכתובת אימייל מאומתת בדומיין pku.edu.cn
Junyi LiUniversity of Montrealכתובת אימייל מאומתת בדומיין umontreal.ca
Tianyi TangQwen Team, Alibaba Group & Renmin University of Chinaכתובת אימייל מאומתת בדומיין alibaba-inc.com
Yifan LiRenmin University of Chinaכתובת אימייל מאומתת בדומיין ruc.edu.cn
Zikang LiuGaoling School of Artificial Intelligence, Renmin University of Chinaכתובת אימייל מאומתת בדומיין ruc.edu.cn

עקוב אחר

Yifan Du

Renmin University of China

כתובת אימייל מאומתת בדומיין ruc.edu.cn - דף הבית

Vision and Language Natural Language Processing


כותרת מיון לפי ציטוט ביבליוגרפי מיון לפי שנה מיון לפי כותרת	צוטט על ידי צוטט על ידי	שנה
A survey of large language models‏ WX Zhao, K Zhou, J Li, T Tang, X Wang, Y Hou, Y Min, B Zhang, J Zhang, ...‏ arXiv preprint arXiv:2303.18223 1 (2), 2023‏	4441*	2023
Evaluating object hallucination in large vision-language models‏ Y Li, Y Du, K Zhou, J Wang, WX Zhao, JR Wen‏ arXiv preprint arXiv:2305.10355, 2023‏	804	2023
A survey of vision-language pre-trained models‏ Y Du, Z Liu, J Li, WX Zhao‏ IJCAI 2022, 2022‏	227	2022
What makes for good visual instructions? synthesizing complex visual reasoning instructions for visual instruction tuning‏ Y Du, H Guo, K Zhou, WX Zhao, J Wang, C Wang, M Cai, R Song, JR Wen‏ arXiv preprint arXiv:2311.01487, 2023‏	17	2023
Learning to imagine: Visually-augmented natural language generation‏ T Tang, Y Chen, Y Du, J Li, WX Zhao, JR Wen‏ arXiv preprint arXiv:2305.16944, 2023‏	13	2023
Needle in a video haystack: A scalable synthetic framework for benchmarking video mllms‏ Z Zhao, H Lu, Y Huo, Y Du, T Yue, L Guo, B Wang, W Chen, J Liu‏ arXiv e-prints, arXiv: 2406.09367, 2024‏	9	2024
Zero-shot visual question answering with language model feedback‏ Y Du, J Li, T Tang, WX Zhao, JR Wen‏ arXiv preprint arXiv:2305.17006, 2023‏	9	2023
Towards event-oriented long video understanding‏ Y Du, K Zhou, Y Huo, Y Li, WX Zhao, H Lu, Z Zhao, B Wang, W Chen, ...‏ arXiv preprint arXiv:2406.14129, 2024‏	7	2024
Virgo: A Preliminary Exploration on Reproducing o1-like MLLM‏ Y Du, Z Liu, Y Li, WX Zhao, Y Huo, B Wang, W Chen, Z Liu, Z Wang, ...‏ arXiv preprint arXiv:2501.01904, 2025‏	3	2025
Exploring the design space of visual context representation in video mllms‏ Y Du, Y Huo, K Zhou, Z Zhao, H Lu, H Huang, WX Zhao, B Wang, W Chen, ...‏ arXiv preprint arXiv:2410.13694, 2024‏	1	2024
Needle In A Video Haystack: A Scalable Synthetic Evaluator for Video MLLMs‏ Z Zhao, H Lu, Y Huo, Y Du, T Yue, L Guo, B Wang, W Chen, J Liu‏ arXiv preprint arXiv:2406.09367, 2024‏		2024

המערכת אינה יכולה לבצע את הפעולה כעת. נסה שוב מאוחר יותר.

מאמרים 1–11

ציטוטים ביבליוגרפיים בשנה

ציטוטים ביביליוגרפיים כפולים

ציטוטים ביביליוגרפיים שמוזגו

הוסף מחברים שותפיםמחברים משותפים

עקוב אחר

צוטט על ידי

מחברים משותפים