Zeming Wei

نقل شده توسط

	همهٔ موارد	از 2020
نقل‌‏قول‌‏ها	452	452
شاخص h	10	10
شاخص i10	10	10

340

170

255

20232024202556 329 65

دسترسی عمومی

مشاهدهٔ همه

۷ مقاله

۰ مقاله

در دسترس

در دسترس نیست

براساس دستورات هزینه انتشار

نویسندگان مشترک

Yisen WangAssistant Professor, Peking Universityایمیل تأیید شده در pku.edu.cn
Yifei WangPostdoc, MIT CSAILایمیل تأیید شده در mit.edu
Yihao ZhangPeking Universityایمیل تأیید شده در stu.pku.edu.cn
Yichuan MoPh.D. Candidate, Peking Universityایمیل تأیید شده در stu.pku.edu.cn
Meng SunProfessor, School of Mathematical Science, Peking Universityایمیل تأیید شده در math.pku.edu.cn
Xiyue ZhangUniversity of Bristolایمیل تأیید شده در bristol.ac.uk
Jingyu Zhuایمیل تأیید شده در stu.pku.edu.cn
Chawin SitawarinPostdoctoral Researcher @ Metaایمیل تأیید شده در meta.com
David WagnerProfessor of Computer Science, UC Berkeleyایمیل تأیید شده در cs.berkeley.edu
Huanran ChenUndergraduate, Beijing Institute of Technologyایمیل تأیید شده در bit.edu.cn
Sun JunProfessor of SCIS, SMUایمیل تأیید شده در smu.edu.sg
Stefanie JegelkaTUM and MITایمیل تأیید شده در mit.edu
Yuyang WuUndergraduate, Peking Universityایمیل تأیید شده در stu.pku.edu.cn
Hangzhou HePeking Universityایمیل تأیید شده در stu.pku.edu.cn
Yinpeng DongTsinghua Universityایمیل تأیید شده در tsinghua.edu.cn
Jun ZhuProfessor of Computer Science, Tsinghua Universityایمیل تأیید شده در mail.tsinghua.edu.cn

دنبال کردن

Zeming Wei

Undergraduate, Peking University

ایمیل تأیید شده در stu.pku.edu.cn - صفحهٔ اصلی

Trustworthy AI Adversarial Robustness Explainability


عنوان به‌ترتیب نقل قول‌ها به‌ترتیب سال به‌ترتیب عنوان	نقل شده توسط نقل شده توسط	سال
Jailbreak and Guard Aligned Language Models with Only Few In-Context Demonstrations‏ Z Wei, Y Wang, A Li, Y Mo, Y Wang‏ arXiv preprint arXiv:2310.06387, 2023‏	205	2023
CFA: Class-wise Calibrated Fair Adversarial Training‏ Z Wei, Y Wang, Y Guo, Y Wang‏ CVPR 2023, 2023‏	65	2023
Jatmo: Prompt injection defense by task-specific finetuning‏ J Piet, M Alrashed, C Sitawarin, S Chen, Z Wei, E Sun, ..., D Wagner‏ ESORICS 2024, 2024‏	51	2024
Fight back against jailbreaking via prompt adversarial tuning‏ Y Mo, Y Wang, Z Wei, Y Wang‏ NeurIPS 2024, 2024‏	22*	2024
Boosting Jailbreak Attack with Momentum‏ Y Zhang, Z Wei(✉️)‏ ICASSP 2025, 2024‏	18	2024
Sharpness-aware minimization alone can improve adversarial robustness‏ Z Wei(✉️), J Zhu, Y Zhang‏ ICML 2023 Workshop on Adversarial Machine Learning, 2023‏	17*	2023
Architecture Matters: Uncovering Implicit Mechanisms in Graph Contrastive Learning‏ X Guo, Y Wang, Z Wei, Y Wang‏ NeurIPS 2023, 2023‏	15	2023
A Theoretical Understanding of Self-Correction through In-context Alignment‏ Y Wang, Y Wu, Z Wei, S Jegelka, Y Wang‏ NeurIPS 2024, 2024‏	11	2024
Weighted Automata Extraction and Explanation of Recurrent Neural Networks for Natural Language Tasks‏ Z Wei, X Zhang, Y Zhang, M Sun‏ Journal of Logical and Algebraic Methods in Programming 136, 100907, 2023‏	11	2023
Extracting weighted finite automata from recurrent neural networks for natural languages‏ Z Wei, X Zhang, M Sun‏ ICFEM 2022, 2022‏	10	2022
On the Duality Between Sharpness-Aware Minimization and Adversarial Training‏ Y Zhang, H He, J Zhu, H Chen, Y Wang, Z Wei(✉️)‏ ICML 2024, 2024‏	9	2024
Using Z3 for Formal Modeling and Verification of FNN Global Robustness‏ Y Zhang, Z Wei, X Zhang, M Sun‏ arXiv preprint arXiv:2304.10558, 2023‏	7	2023
Adversarial Representation Engineering: A General Model Editing Framework for Large Language Models‏ Y Zhang, Z Wei, J Sun, M Sun‏ NeurIPS 2024, 2024‏	5*	2024
Exploring the Robustness of In-Context Learning with Noisy Labels‏ C Cheng, X Yu, H Wen, J Sun, G Yue, Y Zhang, Z Wei(✉️)‏ ICASSP 2025, 2024‏	4	2024
Automata Extraction from Transformers‏ Y Zhang, Z Wei, M Sun‏ arXiv preprint arXiv:2406.05564, 2024‏	1	2024
Identifying and Understanding Cross-Class Features in Adversarial Training‏ Z Wei, Y Guo, Y Wang‏ OpenReview preprint, 2023‏	1*	2023
Towards the Worst-case Robustness of Large Language Models‏ H Chen, Y Dong, Z Wei, H Su, J Zhu‏ arXiv preprint arXiv:2501.19040, 2025‏		2025
MILE: A Mutation Testing Framework of In-Context Learning Systems‏ Z Wei, Y Zhang, M Sun‏ SETTA 2024, 2024‏		2024

سیستم در حال حاضر قادر به انجام عملکرد نیست. بعداً دوباره امتحان کنید.

مقاله‌ها 1–18

نقل‌قول‌ها در سال

نقل‌قول تکراری

نقل‌قول‌های ادغام شده

افزودن نویسنده‌های همکارنویسندگان مشترک

دنبال کردن

نقل شده توسط

نویسندگان مشترک