دنبال کردن
Jaehong Cho
Jaehong Cho
CASYS Lab, KAIST
ایمیل تأیید شده در casys.kaist.ac.kr - صفحهٔ اصلی
عنوان
نقل شده توسط
نقل شده توسط
سال
Neupims: Npu-pim heterogeneous acceleration for batched llm inferencing
G Heo, S Lee, J Cho, H Choi, S Lee, H Ham, G Kim, D Mahajan, J Park
Proceedings of the 29th ACM International Conference on Architectural …, 2024
272024
LLMServingSim: A HW/SW Co-Simulation Infrastructure for LLM Inference Serving at Scale
J Cho, M Kim, H Choi, G Heo, J Park
2024 IEEE International Symposium on Workload Characterization (IISWC), 15-29, 2024
22024
IISWC 2024
J Cho, M Kim, H Choi, G Heo, J Park
LLMServingSim: A Simulation Infrastructure for LLM Inference Serving Systems
J Cho, M Kim, H Choi, J Park
Machine Learning for Computer Architecture and Systems 2024, 0
سیستم در حال حاضر قادر به انجام عملکرد نیست. بعداً دوباره امتحان کنید.
مقاله‌ها 1–4