Guohai Xu

Cytowane przez

	Wszystkie	Od 2020
Cytowania	2139	2127
h-indeks	15	15
i10-indeks	17	17

1500

750

375

1125

20192020202120222023202420259 14 23 45 436 1483 126

Dostęp publiczny

Wyświetl wszystko

2 artykuły

dostępne

niedostępne

Objęte finansowaniem

Współautorzy

Fei HuangCarnegie Mellon University, IBM Research, Facebook, Alibaba DAMO AcademyZweryfikowany adres z alibaba-inc.com
Haiyang XuAlibaba Group, DIDI AI LABS, SEUZweryfikowany adres z seu.edu.cn
Qinghao YeByteDance Ltd.; University of California, San DiegoZweryfikowany adres z ucsd.edu
Hehong ChenDAMO Academy, Alibaba GroupZweryfikowany adres z alibaba-inc.com
Junfeng TianXiaohongshu Inc, nyonic.ai, Alibaba GroupZweryfikowany adres z stu.ecnu.edu.cn
Feng-Lin LiUniversity of TrentoZweryfikowany adres z unitn.it
Yiwei Ma 马祎炜PhD Student, Xiamen UniversityZweryfikowany adres z stu.xmu.edu.cn
Feng JiTencent Inc.Zweryfikowany adres z tencent.com
Qianglong ChenZhejiang UniversityZweryfikowany adres z zju.edu.cn
Chengyu WangAlibaba GroupZweryfikowany adres z alibaba-inc.com
Ming YanAlibaba Group

Obserwuj

Guohai Xu

DAMO Academy, Alibaba Group

Zweryfikowany adres z alibaba-inc.com

MLLM Alignment


Tytuł Sortuj wg cytatów Sortuj wg roku Sortuj wg tytułu	Cytowane przez Cytowane przez	Rok
mPLUG-Owl: Modularization empowers large language models with multimodality Q Ye, H Xu, G Xu, J Ye, M Yan, Y Zhou, J Wang, A Hu, P Shi, Y Shi, C Li, ... arXiv preprint arXiv:2304.14178, 2023	828	2023
X-CLIP: End-to-end multi-grained contrastive learning for video-text retrieval Y Ma, G Xu, X Sun, M Yan, J Zhang, R Ji Proceedings of the 30th ACM International Conference on Multimedia, 638-647, 2022	267	2022
mPLUG-2: A modularized multi-modal foundation model across text, image and video H Xu, Q Ye, M Yan, Y Shi, J Ye, Y Xu, C Li, B Bi, Q Qian, W Wang, G Xu, ... arXiv preprint arXiv:2302.00402, 2023	129	2023
mPLUG: Effective and Efficient Vision-Language Learning by Cross-modal Skip-connections C Li, H Xu, J Tian, W Wang, M Yan, B Bi, J Ye, H Chen, G Xu, Z Cao, ... Proceedings of the 2022 Conference on Empirical Methods in Natural Language …, 2022	122	2022
UReader: Universal ocr-free visually-situated language understanding with multimodal large language model J Ye, A Hu, H Xu, Q Ye, M Yan, G Xu, C Li, J Tian, Q Qian, J Zhang, Q Jin, ... arXiv preprint arXiv:2310.05126, 2023	113	2023
mPLUG-DocOwl: Modularized multimodal large language model for document understanding J Ye, A Hu, H Xu, Q Ye, M Yan, Y Dan, C Zhao, G Xu, C Li, J Tian, Q Qi, ... arXiv preprint arXiv:2307.02499, 2023	109	2023
Evaluation and analysis of hallucination in large vision-language models J Wang, Y Zhou, G Xu, P Shi, C Zhao, H Xu, Q Ye, M Yan, J Zhang, J Zhu, ... arXiv preprint arXiv:2308.15126, 2023	106	2023
AMBER: An LLM-free Multi-dimensional Benchmark for MLLMs Hallucination Evaluation J Wang, Y Wang, G Xu, J Zhang, Y Gu, H Jia, M Yan, J Zhang, J Sang arXiv preprint arXiv:2311.07397, 2023	88	2023
HiTeA: Hierarchical temporal-aware video-language pre-training Q Ye, G Xu, M Yan, H Xu, Q Qian, J Zhang, F Huang Proceedings of the IEEE/CVF International Conference on Computer Vision …, 2023	75	2023
AliMeKG: Domain knowledge graph construction and application in e-commerce FL Li, H Chen, G Xu, T Qiu, F Ji, J Zhang, H Chen Proceedings of the 29th ACM International Conference on Information …, 2020	71	2020
CValues: Measuring the values of chinese large language models from safety to responsibility G Xu, J Liu, M Yan, H Xu, J Si, Z Zhou, P Yi, X Gao, J Sang, R Zhang, ... arXiv preprint arXiv:2307.09705, 2023	62	2023
Improving clinical named entity recognition with global neural attention G Xu, C Wang, X He Web and Big Data: Second International Joint Conference, APWeb-WAIM 2018 …, 2018	49	2018
Dictbert: Dictionary description knowledge enhanced language model pre-training via contrastive learning Q Chen, FL Li, G Xu, M Yan, J Zhang, Y Zhang Proceedings of the 31st International Joint Conference on Artificial …, 2022	25	2022
Youku-mplug: A 10 million large-scale chinese video-language dataset for pre-training and benchmarks H Xu, Q Ye, X Wu, M Yan, Y Miao, J Ye, G Xu, A Hu, Y Shi, G Xu, C Li, ... arXiv preprint arXiv:2306.04362, 2023	21	2023
AliMe MKG: A multi-modal knowledge graph for live-streaming e-commerce G Xu, H Chen, FL Li, F Sun, Y Shi, Z Zeng, W Zhou, Z Zhao, J Zhang Proceedings of the 30th ACM International Conference on Information …, 2021	21	2021
Medical question retrieval based on siamese neural network and transfer learning method K Wang, B Yang, G Xu, X He Database Systems for Advanced Applications: DASFAA 2019 International …, 2019	13	2019
Chatplug: Open-domain generative dialogue system with internet-augmented instruction tuning for digital human J Tian, H Chen, G Xu, M Yan, X Gao, J Zhang, C Li, J Liu, W Xu, H Xu, ... arXiv preprint arXiv:2304.07849, 2023	10	2023
Distinguish before answer: Generating contrastive explanation as knowledge for commonsense question answering Q Chen, G Xu, M Yan, J Zhang, F Huang, L Si, Y Zhang arXiv preprint arXiv:2305.08135, 2023	9	2023
Validity, feasibility, and effectiveness of a voice‐recognition based digital cognitive screener for dementia and mild cognitive impairment in community‐dwelling older Chinese … X Zhao, H Wen, G Xu, T Pang, Y Zhang, X He, R Hu, M Yan, C Chen, ... Alzheimer's & Dementia 20 (4), 2384-2396, 2024	8	2024
A voice recognition-based digital cognitive screener for dementia detection in the community: Development and validation study X Zhao, R Hu, H Wen, G Xu, T Pang, X He, Y Zhang, J Zhang, C Chen, ... Frontiers in Psychiatry 13, 899729, 2022	7	2022

Nie można teraz wykonać tej operacji. Spróbuj ponownie później.

Prace 1–20

Cytowania rocznie

Powielone cytowania

Scalone cytowania

Dodaj współautorówWspółautorzy

Obserwuj

Cytowane przez

Współautorzy