متابعة
Xinhao Cheng
Xinhao Cheng
CS PhD student at Carnegie Mellon University
بريد إلكتروني تم التحقق منه على andrew.cmu.edu - الصفحة الرئيسية
عنوان
عدد مرات الاقتباسات
عدد مرات الاقتباسات
السنة
SpecInfer: Accelerating Generative Large Language Model Serving with Tree-based Speculative Inference and Verification
X Miao, G Oliaro, Z Zhang, X Cheng, Z Wang, Z Zhang, RYY Wong, A Zhu, ...
Proceedings of the 29th ACM International Conference on Architectural …, 2023
207*2023
Towards Efficient Generative Large Language Model Serving: A Survey from Algorithms to Systems
X Miao, G Oliaro, Z Zhang, X Cheng, H Jin, T Chen, Z Jia
arXiv preprint arXiv:2312.15234, 2023
732023
FlexLLM: A System for Co-Serving Large Language Model Inference and Parameter-Efficient Finetuning
X Miao, G Oliaro, X Cheng, M Wu, C Unger, Z Jia
arXiv preprint arXiv:2402.18789, 2024
52024
A Multi-Level Superoptimizer for Tensor Programs
M Wu, X Cheng, O Padon, Z Jia
arXiv preprint arXiv:2405.05751, 2024
12024
يتعذر على النظام إجراء العملية في الوقت الحالي. عاود المحاولة لاحقًا.
مقالات 1–4