Wai Man Si

20222023202420255 38 60 11

Veřejný přístup

2 články

1 článek

dostupné

nedostupné

Vychází ze zplnomocnění pro financování

Yang ZhangFaculty at CISPA Helmholtz Center for Information SecurityE-mailová adresa ověřena na: cispa.de
Michael BackesChairman and Founding Director of the CISPA Helmholtz Center for Information SecurityE-mailová adresa ověřena na: cispa.saarland
Savvas ZannettouAssistant Professor at Delft University of TechnologyE-mailová adresa ověřena na: tudelft.nl
Jeremy BlackburnAssociate Professor, Binghamton University School of ComputingE-mailová adresa ověřena na: binghamton.edu
Emiliano De CristofaroProfessor at University of California, RiversideE-mailová adresa ověřena na: ucr.edu
Gianluca StringhiniAssociate Professor at Boston UniversityE-mailová adresa ověřena na: bu.edu
Mark RiedlProfessor of Computing, Georgia Institute of TechnologyE-mailová adresa ověřena na: cc.gatech.edu
Prithviraj AmmanabroluAssistant Professor, University of California, San DiegoE-mailová adresa ověřena na: ucsd.edu
Mingjie LiPostdoc Researcher, CISPAE-mailová adresa ověřena na: pku.edu.cn

Wai Man Si

CISPA

E-mailová adresa ověřena na: cispa.de - Domovská stránka


Název Seřadit podle citací Seřadit podle roku Seřadit podle názvu	Citace Citace	Rok
Why so toxic? measuring and triggering toxic behavior in open-domain chatbots WM Si, M Backes, J Blackburn, E De Cristofaro, G Stringhini, S Zannettou, ... CCS 2022, 2022	72	2022
Two-in-One: A Model Hijacking Attack Against Text Generation Models WM Si, M Backes, Y Zhang, A Salem USENIX 2023, 2023	17	2023
Telling Stories through Multi-User Dialogue by Modeling Character Relations WM Si, P Ammanabrolu, MO Riedl SIGDIAL 2021, 2021	13	2021
Mondrian: Prompt abstraction attack against large language models for cheaper api pricing WM Si, M Backes, Y Zhang arXiv preprint arXiv:2308.03558, 2023	6	2023
Comprehensive assessment of toxicity in ChatGPT B Zhang, X Shen, WM Si, Z Sha, Z Chen, A Salem, Y Shen, M Backes, ... arXiv preprint arXiv:2311.14685, 2023	5	2023
SaLoRA: Safety-Alignment Preserved Low-Rank Adaptation M Li, WM Si, M Backes, Y Zhang, Y Wang ICLR 2025, 2025	1	2025
ICLGuard: Controlling In-Context Learning Behavior for Applicability Authorization WM Si, M Backes, Y Zhang arXiv preprint arXiv:2407.06955, 2024	1	2024
Boosting Variational Generative Model via Condition Enhancing and Lexical-Editing Z Tao, W Si, J Li, D Zhao, R Yan PRICAI 2019, 2019		2019

Systém momentálně nemůže danou operaci provést. Zkuste to znovu později.

Články 1–8

Citace za rok