Sledovat
Vikranth Srivatsa
Vikranth Srivatsa
E-mailová adresa ověřena na: ucsd.edu - Domovská stránka
Název
Citace
Citace
Rok
Infercept: Efficient intercept support for augmented large language model inference
R Abhyankar, Z He, V Srivatsa, H Zhang, Y Zhang
arXiv preprint arXiv:2402.01869, 2024
122024
Apiserve: Efficient api support for large-language model inferencing
R Abhyankar, Z He, V Srivatsa, H Zhang, Y Zhang
arXiv e-prints, arXiv: 2402.01869, 2024
72024
The effect of model size on worst-group generalization
A Pham, E Chan, V Srivatsa, D Ghosh, Y Yang, Y Yu, R Zhong, ...
arXiv preprint arXiv:2112.04094, 2021
52021
Preble: Efficient distributed prompt scheduling for llm serving
V Srivatsa, Z He, R Abhyankar, D Li, Y Zhang
arXiv preprint arXiv:2407.00023, 2024
42024
Cognify: Supercharging Gen-AI Workflows With Hierarchical Autotuning
Z He, R Abhyankar, V Srivatsa, Y Zhang
arXiv preprint arXiv:2502.08056, 2025
2025
Systém momentálně nemůže danou operaci provést. Zkuste to znovu později.
Články 1–5