Haoyu Lu

Процитировано

	Все	Начиная с 2020 г.
Статистика цитирования	1113	1111
h-индекс	10	10
i10-индекс	10	10

660

330

165

495

202120222023202420259 95 208 656 137

Общий доступ

Просмотреть все

6 статей

0 статей

доступно

недоступно

На основе финансирования

Соавторы

Yuqi HuoBaichuan Inc.Подтвержден адрес электронной почты в домене baichuan-inc.com
Zhiwu LuProfessor, Renmin University of ChinaПодтвержден адрес электронной почты в домене ruc.edu.cn
Ji-Rong WenRenmin University of ChinaПодтвержден адрес электронной почты в домене ruc.edu.cn
Hao Sun (孙浩)Associate Professor with Tenure, GSAI, Renmin University of ChinaПодтвержден адрес электронной почты в домене ruc.edu.cn
Ping Luo (羅平)Associate Professor, The University of Hong Kong; MMLAB@HKUПодтвержден адрес электронной почты в домене hku.hk
Mingyu DingAssistant Professor, UNC Chapel HillПодтвержден адрес электронной почты в домене cs.unc.edu
Ruihua SongRenmin University of ChinaПодтвержден адрес электронной почты в домене ruc.edu.cn
Bo ZhangZhejiang University, ZJU100 Young ProfessorПодтвержден адрес электронной почты в домене zju.edu.cn
Wen LiuDeepSeek AIПодтвержден адрес электронной почты в домене shanghaitech.edu.cn

Haoyu Lu

Renmin University of China

Подтвержден адрес электронной почты в домене ruc.edu.cn - Главная страница

multimodal pre-training video-language modeling


Название По числу цитат По году По названию	Процитировано Процитировано	Год
Towards artificial general intelligence via a multimodal foundation model N Fei, Z Lu, Y Gao, G Yang, Y Huo, J Wen, H Lu, R Song, X Gao, T Xiang, ... Nature Communications 13 (1), 3094, 2022	257	2022
Deepseek LLM: Scaling open-source language models with longtermism X Bi, D Chen, G Chen, S Chen, D Dai, C Deng, H Ding, K Dong, Q Du, ... arXiv preprint arXiv:2401.02954, 2024	212	2024
Deepseek-VL: Towards Real-world Vision-language Understanding H Lu, W Liu, B Zhang, B Wang, K Dong, B Liu, J Sun, T Ren, Z Li, Y Sun, ... arXiv preprint arXiv:2403.05525, 2024	210	2024
WenLan: Bridging vision and language by large-scale multi-modal pre-training Y Huo, M Zhang, G Liu, H Lu, Y Gao, G Yang, J Wen, H Zhang, B Xu, ... arXiv preprint arXiv:2103.06561, 2021	181*	2021
COTS: Collaborative two-stream vision-language pre-training model for cross-modal retrieval H Lu, N Fei, Y Huo, Y Gao, Z Lu, JR Wen Proceedings of the IEEE/CVF conference on computer Vision and pattern …, 2022	75	2022
VDT: General-purpose Video Diffusion Transformers via Mask Modeling H Lu, G Yang, N Fei, Y Huo, Z Lu, P Luo, M Ding The Twelfth International Conference on Learning Representations, 2024	60*	2024
Uniadapter: Unified parameter-efficient transfer learning for cross-modal modeling H Lu, Y Huo, G Yang, Z Lu, W Zhan, M Tomizuka, M Ding The Twelfth International Conference on Learning Representations, 2024	29	2024
Self-supervised video representation learning with constrained spatiotemporal jigsaw Y Huo, M Ding, H Lu, Z Lu, T Xiang, JR Wen, Z Huang, J Jiang, S Zhang, ...	22	2021
Learning versatile neural architectures by propagating network codes M Ding, Y Huo, H Lu, L Yang, Z Wang, Z Lu, J Wang, P Luo arXiv preprint arXiv:2103.13253, 2021	17	2021
LGDN: Language-Guided Denoising Network for Video-Language Modeling H Lu, M Ding, N Fei, Y Huo, Z Lu Advances in Neural Information Processing Systems, 2022, 2022	11	2022
Needle in a video haystack: A scalable synthetic framework for benchmarking video mllms Z Zhao, H Lu, Y Huo, Y Du, T Yue, L Guo, B Wang, W Chen, J Liu arXiv e-prints, arXiv: 2406.09367, 2024	9	2024
Compressed video contrastive learning Y Huo, M Ding, H Lu, N Fei, Z Lu, JR Wen, P Luo Advances in Neural Information Processing Systems 34, 14176-14187, 2021	9	2021
Kimi k1. 5: Scaling reinforcement learning with llms K Team, A Du, B Gao, B Xing, C Jiang, C Chen, C Li, C Xiao, C Du, C Liao, ... arXiv preprint arXiv:2501.12599, 2025	8	2025
Towards event-oriented long video understanding Y Du, K Zhou, Y Huo, Y Li, WX Zhao, H Lu, Z Zhao, B Wang, W Chen, ... arXiv preprint arXiv:2406.14129, 2024	7	2024
BMU-MoCo: Bidirectional momentum update for continual video-language modeling Y Gao, N Fei, H Lu, Z Lu, H Jiang, Y Li, Z Cao Advances in Neural Information Processing Systems 35, 22699-22712, 2022	5	2022
Exploring the design space of visual context representation in video mllms Y Du, Y Huo, K Zhou, Z Zhao, H Lu, H Huang, WX Zhao, B Wang, W Chen, ... arXiv preprint arXiv:2410.13694, 2024	1	2024
Beyond Filtering: Adaptive Image-Text Quality Enhancement for MLLM Pretraining H Huang, Y Huo, Z Zhao, H Lu, S Wu, B Wang, Q Liu, W Chen, L Wang arXiv preprint arXiv:2410.16166, 2024		2024
Needle In A Video Haystack: A Scalable Synthetic Evaluator for Video MLLMs Z Zhao, H Lu, Y Huo, Y Du, T Yue, L Guo, B Wang, W Chen, J Liu arXiv preprint arXiv:2406.09367, 2024		2024

В данный момент система не может выполнить эту операцию. Повторите попытку позднее.

Статьи 1–18

Ссылок за год

Повторяющиеся цитирования

Объединенные цитирования

СоавторыСоавторы

Подписаться

Процитировано

Соавторы