Prompt 注入红队与基准集

无标签

人工智能

发布日期: 2025-09-12

1. 样例采集

真实流量与公开集；敏感策略与红队技巧。

2. 对抗生成

自动化生成攻击样例；多模板覆盖；多语言与变体。

3. 评分与回归

判别器/评分器；基线与趋势；发布门禁。

张显达

https://zhangxianda.com/ai/security-prompt-redteaming-benchmarks/

本博客所有文章除特別声明外，均采用 CC BY 4.0 许可协议。转载请注明来源张显达 !

无标签

上一篇

AI 输出合规与敏感信息检测

AI 输出合规与敏感信息检测

2025-09-12 人工智能

下一篇

Storybook + 视觉回归流水线

Storybook + 视觉回归流水线

2025-09-12 前端