Yaya Shi

Навело

	Све	Од 2020
Наводи	1487	1484
h-индекс	9	9
i10-индекс	7	7

860

430

215

645

20202021202220232024202513 73 90 313 860 135

Јавни приступ

Прикажи све

3 чланка

1 чланак

доступно

није доступно

На основу услова финансирања

Коаутори

Haiyang XuAlibaba Group, DIDI AI LABS, SEUВерификована је имејл адреса на seu.edu.cn
Ji ZhangAlibaba GroupВерификована је имејл адреса на alibaba-inc.com
Qinghao YeByteDance Ltd.; University of California, San DiegoВерификована је имејл адреса на ucsd.edu
Fei HuangCarnegie Mellon University, IBM Research, Facebook, Alibaba DAMO AcademyВерификована је имејл адреса на alibaba-inc.com
Chenliang LiAlibaba Inc.Верификована је имејл адреса на alibaba-inc.com
Chunfeng YuanNational Laboratory of Pattern Recognition, Institute of Automation, Chinese Academy of SciencesВерификована је имејл адреса на nlpr.ia.ac.cn
Weiming HuNLPRВерификована је имејл адреса на nlpr.ia.ac.cn
Bing LiProfessor of National Laboratory of Pattern Recognition, Institute of Automation, ChineseВерификована је имејл адреса на nlpr.ia.ac.cn
Qi QianZoomВерификована је имејл адреса на zoom.us
Anwen HuAlibaba GroupВерификована је имејл адреса на ruc.edu.cn
Guohai XuDAMO Academy, Alibaba GroupВерификована је имејл адреса на alibaba-inc.com
查正军，Zheng-Jun Zha中国科学技术大学Верификована је имејл адреса на ustc.edu.cn
Yuanhong XuAlibaba GroupВерификована је имејл адреса на alibaba-inc.com
Hehong ChenDAMO Academy, Alibaba GroupВерификована је имејл адреса на alibaba-inc.com
Yiyang ZhouPh.D. Student, UNC Chapel Hill CSВерификована је имејл адреса на cs.unc.edu
Haowei LiuInstitute of Automation, Chinese Academy of SciencesВерификована је имејл адреса на ia.ac.cn
XU YANGSoutheast UniversityВерификована је имејл адреса на seu.edu.cn
Zongyang MaMAIS & NLPR, Institute of Automation, Chinese Academy of Sciences.Верификована је имејл адреса на ia.ac.cn
Ziqi ZhangPh.D. of Institute of automation, Chinese Academy of SciencesВерификована је имејл адреса на ia.ac.cn

Прати

Yaya Shi

University of Science and Technology of China

Верификована је имејл адреса на mail.ustc.edu.cn - Почетна страница

multimodal (CV&NLP) understanding and generation


Наслов Сортирај по наводима Сортирај по години Сортирај по наслову	Навело Навело	Година
mplug-owl: Modularization empowers large language models with multimodality Q Ye, H Xu, G Xu, J Ye, M Yan, Y Zhou, J Wang, A Hu, P Shi, Y Shi, C Li, ... arXiv preprint arXiv:2304.14178, 2023	841	2023
Object relational graph with teacher-recommended learning for video captioning Z Zhang, Y Shi, C Yuan, B Li, P Wang, W Hu, ZJ Zha Proceedings of the IEEE/CVF conference on computer vision and pattern …, 2020	373	2020
mplug-2: A modularized multi-modal foundation model across text, image and video H Xu, Q Ye, M Yan, Y Shi, J Ye, Y Xu, C Li, B Bi, Q Qian, W Wang, G Xu, ... International Conference on Machine Learning, 38728-38748, 2023	134	2023
Emscore: Evaluating video captioning via coarse-grained and fine-grained embedding matching Y Shi, X Yang, H Xu, C Yuan, B Li, W Hu, ZJ Zha Proceedings of the IEEE/CVF conference on computer vision and pattern …, 2022	41	2022
mplug-paperowl: Scientific diagram analysis with the multimodal large language model A Hu, Y Shi, H Xu, J Ye, Q Ye, M Yan, C Li, Q Qian, J Zhang, F Huang Proceedings of the 32nd ACM International Conference on Multimedia, 6929-6938, 2024	32	2024
Youku-mplug: A 10 million large-scale chinese video-language dataset for pre-training and benchmarks H Xu, Q Ye, X Wu, M Yan, Y Miao, J Ye, G Xu, A Hu, Y Shi, G Xu, C Li, ... arXiv preprint arXiv:2306.04362, 2023	23	2023
Learning video-text aligned representations for video captioning Y Shi, H Xu, C Yuan, B Li, W Hu, ZJ Zha ACM Transactions on Multimedia Computing, Communications and Applications 19 …, 2023	18	2023
Mibench: Evaluating multimodal large language models over multiple images H Liu, X Zhang, H Xu, Y Shi, C Jiang, M Yan, J Zhang, F Huang, C Yuan, ... arXiv preprint arXiv:2407.15272, 2024	9	2024
mPLUGOwl: Modularization Empowers Large Language Models with Multimodality. CoRR abs/2304.14178 (2023) Q Ye, H Xu, G Xu, J Ye, M Yan, Y Zhou, J Wang, A Hu, P Shi, Y Shi, C Li, ...	9	2023
Learning semantics-grounded vocabulary representation for video-text retrieval Y Shi, H Liu, H Xu, Z Ma, Q Ye, A Hu, M Yan, J Zhang, F Huang, C Yuan, ... Proceedings of the 31st ACM International Conference on Multimedia, 4460-4470, 2023	5	2023
Uniqrnet: Unifying referring expression grounding and segmentation with qrnet J Ye, J Tian, M Yan, H Xu, Q Ye, Y Shi, X Yang, X Wang, J Zhang, L He, ... ACM Transactions on Multimedia Computing, Communications and Applications 20 …, 2024	2	2024
iMOVE: Instance-Motion-Aware Video Understanding J Li, Y Shi, Z Ma, H Xu, F Cheng, H Xiao, R Kang, F Yang, T Gao, D Zhang arXiv preprint arXiv:2502.11594, 2025		2025
Semantics-enhanced Cross-modal Masked Image Modeling for Vision-Language Pre-training H Liu, Y Shi, H Xu, C Yuan, Q Ye, C Li, M Yan, J Zhang, F Huang, B Li, ... arXiv preprint arXiv:2403.00249, 2024		2024
Unifying Latent and Lexicon Representations for Effective Video-Text Retrieval H Liu, Y Shi, H Xu, C Yuan, Q Ye, C Li, M Yan, J Zhang, F Huang, B Li, ... arXiv preprint arXiv:2402.16769, 2024		2024
VATEX Captioning Challenge 2019: Multi-modal Information Fusion and Multi-stage Training Strategy for Video Captioning Z Zhang, Y Shi, J Wei, C Yuan, B Li, W Hu arXiv preprint arXiv:1910.05752, 2019		2019

Систем тренутно не може да изврши ову радњу. Пробајте поново касније.

Чланци 1–15

Годишњи број навода

Дупли наводи

Обједињени наводи

Додавање коаутораКоаутори

Прати

Навело

Коаутори