Prompt 注入红队与基准集


1. 样例采集

  • 真实流量与公开集;敏感策略与红队技巧。

2. 对抗生成

  • 自动化生成攻击样例;多模板覆盖;多语言与变体。

3. 评分与回归

  • 判别器/评分器;基线与趋势;发布门禁。

文章作者: 张显达
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 张显达 !
  目录