Zhe Chen (陈喆)

Процитировано

	Все	Начиная с 2020 г.
Статистика цитирования	3737	3734
h-индекс	20	20
i10-индекс	23	23

2700

1350

675

2025

202220232024202534 583 2659 443

Общий доступ

Просмотреть все

6 статей

0 статей

доступно

недоступно

На основе финансирования

Соавторы

Wenhai Wang (王文海)CUHK | Shanghai AI Laboratory | NJUПодтвержден адрес электронной почты в домене cuhk.edu.hk
Yu QiaoProfessor of Shanghai AI Laboratory; Shenzhen Institutes of Advanced Technology, CASПодтвержден адрес электронной почты в домене siat.ac.cn
Jifeng DaiAssociate Professor of EE, Tsinghua University; Adjuct Researcher of Shanghai AI LaboratoryПодтвержден адрес электронной почты в домене tsinghua.edu.cn
Xizhou ZhuTsinghua UniversityПодтвержден адрес электронной почты в домене tsinghua.edu.cn
Lewei LuResearch Director (We're Hiring, [email protected]) @ SenseTime ResearchПодтвержден адрес электронной почты в домене sensetime.com
Ping Luo (羅平)Associate Professor, The University of Hong Kong; MMLAB@HKUПодтвержден адрес электронной почты в домене hku.hk
Jiannan WuThe University of Hong KongПодтвержден адрес электронной почты в домене connect.hku.hk
Yuchen Duan (段雨辰)Ph.D Student, The Chinese University of Hong KongПодтвержден адрес электронной почты в домене link.cuhk.edu.hk
Enze XieNVIDIA Research, MMLab@HKUПодтвержден адрес электронной почты в домене connect.hku.hk
Zhenhang HuangShanghai AI LabПодтвержден адрес электронной почты в домене pjlab.org.cn
Guo ChenNanjing UniversityПодтвержден адрес электронной почты в домене smail.nju.edu.cn
Zhiqi LiPhD candidate, Nanjing UniversityПодтвержден адрес электронной почты в домене smail.nju.edu.cn
Qingyun Li (李青云)HIT(Harbin Institute of Technology)Подтвержден адрес электронной почты в домене stu.hit.edu.cn
Kunchang LiShenzhen Institutes of Advanced Technology, Chinese Academy of SciencesПодтвержден адрес электронной почты в домене siat.ac.cn
Weijie SuShanghai AI LaboratoryПодтвержден адрес электронной почты в домене pjlab.org.cn
Weiyun WangShanghai AI Laboratory; Fudan UniversityПодтвержден адрес электронной почты в домене pjlab.org.cn
Yuanfeng JiThe Univeristy of HongkongПодтвержден адрес электронной почты в домене connect.hku.hk
Tao WangNanjing UniversityПодтвержден адрес электронной почты в домене smail.nju.edu.cn
Kai ChenHong Kong University of Science and TechnologyПодтвержден адрес электронной почты в домене connect.ust.hk
Tong LuNanjing University

Zhe Chen (陈喆)

PhD candidate, Nanjing University

Подтвержден адрес электронной почты в домене smail.nju.edu.cn - Главная страница

Computer Vision Multimodal Large Language Model


Название По числу цитат По году По названию	Процитировано Процитировано	Год
InternImage: Exploring Large-Scale Vision Foundation Models with Deformable Convolutions W Wang, J Dai, Z Chen, Z Huang, Z Li, X Zhu, X Hu, T Lu, L Lu, H Li, ... IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR) Highlight, 2023	824	2023
Vision Transformer Adapter for Dense Predictions Z Chen, Y Duan, W Wang, J He, T Lu, J Dai, Y Qiao International Conference on Learning Representation (ICLR) Spotlight, 2022	617	2022
InternVL: Scaling up vision foundation models and aligning for generic visual-linguistic tasks Z Chen, J Wu, W Wang, W Su, G Chen, S Xing, Z Muyan, Q Zhang, X Zhu, ... IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR) Oral, 2024	612*	2024
VisionLLM: Large Language Model is Also an Open-Ended Decoder for Vision-Centric Tasks W Wang, Z Chen, X Chen, J Wu, X Zhu, G Zeng, P Luo, T Lu, J Zhou, ... Advances in Neural Information Processing Systems (NeurIPS), 2023	446	2023
How far are we to gpt-4v? closing the gap to commercial multimodal models with open-source suites Z Chen, W Wang, H Tian, S Ye, Z Gao, E Cui, W Tong, K Hu, J Luo, Z Ma, ... Science China Information Sciences 67 (12), 220101, 2024	356	2024
DDP: Diffusion Model for Dense Visual Prediction Y Ji, Z Chen, E Xie, L Hong, X Liu, Z Liu, T Lu, Z Li, P Luo IEEE/CVF International Conference on Computer Vision (ICCV), 2023	114	2023
Internlm-xcomposer2-4khd: A pioneering large vision-language model handling resolutions from 336 pixels to 4k hd X Dong, P Zhang, Y Zang, Y Cao, B Wang, L Ouyang, S Zhang, H Duan, ... Neural Information Processing Systems (NeurIPS), 2024	109	2024
InternGPT: Solving vision-centric tasks by interacting with chatbots beyond language Z Liu, Y He, W Wang, W Wang, Y Wang, S Chen, Q Zhang, Y Yang, Q Li, ... arXiv preprint arXiv:2305.05662, 2023	90	2023
The All-Seeing Project: Towards Panoptic Visual Recognition and Understanding of the Open World W Wang, M Shi, Q Li, W Wang, Z Huang, L Xing, Z Chen, H Li, X Zhu, ... The Twelfth International Conference on Learning Representations (ICLR), 2023	78	2023
Video mamba suite: State space model as a versatile alternative for video understanding G Chen, Y Huang, J Xu, B Pei, Z Chen, Z Li, J Wang, K Li, T Lu, L Wang arXiv preprint arXiv:2403.09626, 2024	61	2024
GeoDiffusion: Text-Prompted Geometric Control for Object Detection Data Generation K Chen, E Xie, Z Chen, L Hong, Z Li, DY Yeung The Twelfth International Conference on Learning Representations (ICLR), 2023	44*	2023
InternVideo-Ego4D: A Pack of Champion Solutions to Ego4D Challenges G Chen, S Xing, Z Chen, Y Wang, K Li, Y Li, Y Liu, J Wang, YD Zheng, ... Technical Report of Ego4D Challenge 2022 @ ECCV, 2022	43	2022
Avsegformer: Audio-visual segmentation with transformer S Gao, Z Chen, G Chen, W Wang, T Lu Proceedings of the AAAI Conference on Artificial Intelligence 38 (11), 12155 …, 2024	37	2024
Vision-rwkv: Efficient and scalable visual perception with rwkv-like architectures Y Duan, W Wang, Z Chen, X Zhu, L Lu, T Lu, Y Qiao, H Li, J Dai, W Wang International Conference on Learning Representation (ICLR) Spotlight, 2024	37	2024
The all-seeing project v2: Towards general relation comprehension of the open world W Wang, Y Ren, H Luo, T Li, C Yan, Z Chen, W Wang, Q Li, L Lu, X Zhu, ... European Conference on Computer Vision, 471-490, 2024	36	2024
Mm-interleaved: Interleaved image-text generative modeling via multi-modal feature synchronizer C Tian, X Zhu, Y Xiong, W Wang, Z Chen, W Wang, Y Chen, L Lu, T Lu, ... arXiv preprint arXiv:2401.10208, 2024	36	2024
VisionLLM v2: An End-to-End Generalist Multimodal Large Language Model for Hundreds of Vision-Language Tasks J Wu, M Zhong, S Xing, Z Lai, Z Liu, W Wang, Z Chen, X Zhu, L Lu, T Lu, ... Neural Information Processing Systems (NeurIPS), 2024	30	2024
Towards Ultra-Resolution Neural Style Transfer via Thumbnail Instance Normalization Z Chen, W Wang, E Xie, T Lu, P Luo Proceedings of the AAAI Conference on Artificial Intelligence 36 (1), 393-400, 2022	28	2022
Expanding performance boundaries of open-source multimodal models with model, data, and test-time scaling Z Chen, W Wang, Y Cao, Y Liu, Z Gao, E Cui, J Zhu, S Ye, H Tian, Z Liu, ... arXiv preprint arXiv:2412.05271, 2024	27	2024
FAST: Faster Arbitrarily-Shaped Text Detector with Minimalist Kernel Representation Z Chen, J Wang, W Wang, G Chen, E Xie, P Luo, T Lu arXiv preprint arXiv:2111.02394, 2021	22	2021

В данный момент система не может выполнить эту операцию. Повторите попытку позднее.

Статьи 1–20

Ссылок за год

Повторяющиеся цитирования

Объединенные цитирования

СоавторыСоавторы

Подписаться

Процитировано

Соавторы