Backdoor Training - Search News

Detecting backdoored language models at scale

Learn how Microsoft research uncovers backdoor risks in language models and introduces a practical scanner to detect tampering and strengthen AI security.

Security Boulevard

NDSS 2025 – PBP: Post-Training Backdoor Purification For Malware Classifiers

Dung Thuy Nguyen (Vanderbilt University), Ngoc N. Tran (Vanderbilt University), Taylor T. Johnson (Vanderbilt University), Kevin Leach (Vanderbilt University) PAPER PBP: Post-Training Backdoor ...

Some results have been hidden because they may be inaccessible to you

Show inaccessible results

Detecting backdoored language models at scale

NDSS 2025 – PBP: Post-Training Backdoor Purification For Malware Classifiers

Trending now