دنبال کردن
Zhennan Shen
Zhennan Shen
ایمیل تأیید شده در sjtu.edu.cn
عنوان
نقل شده توسط
نقل شده توسط
سال
Scieval: A multi-level large language model evaluation benchmark for scientific research
L Sun, Y Han, Z Zhao, D Ma, Z Shen, B Chen, L Chen, K Yu
Proceedings of the AAAI Conference on Artificial Intelligence 38 (17), 19053 …, 2024
472024
SciDFM: A Large Language Model with Mixture-of-Experts for Science
L Sun, D Luo, D Ma, Z Zhao, B Chen, Z Shen, S Zhu, L Chen, X Chen, ...
arXiv preprint arXiv:2409.18412, 2024
12024
MobileEnv: Building Qualified Evaluation Benchmarks for LLM-GUI Interaction
D Zhang, Z Shen, R Xie, S Zhang, T Xie, Z Zhao, S Chen, L Chen, H Xu, ...
12024
AgentTrek: Agent Trajectory Synthesis via Guiding Replay with Web Tutorials
VIAG REPLAY
سیستم در حال حاضر قادر به انجام عملکرد نیست. بعداً دوباره امتحان کنید.
مقاله‌ها 1–4