2025年9月18日AI安全情报：资本押注防御，攻防对抗升级

模型防御供应链安全资金动向

AI安全

发布日期: 2025-09-18

资金与产业动向

Irregular 获得 8000 万美元融资，正在搭建面向 Claude、ChatGPT 等前沿模型的攻防实验室，用于验证越狱与渗透韧性（SecurityWeek，2025-09-17；TechCrunch，2025-09-17）。
Scalekit 完成 550 万美元融资，聚焦大模型代理身份认证与出站动作控制，补齐“代理调用链”的安全缺口（SecurityWeek，2025-09-17）。

威胁态势

俄罗斯“假新闻”网络借助 AI 重新上线 200 余个站点，自动生成政治虚假内容，凸显内容安全长期战（The Register，2025-09-18）。
ARMO 研究披露 io_uring 可以绕过多数 Linux 运行时安全工具，为攻击者提供隐藏通道（InfoQ，2025-09-16）。

安全要点拆解

多层测试防线：将资金驱动的红蓝对抗能力转化为常态化测试，在 CI/CD 中加入提示注入、越权操作、模型幻觉等场景的基线用例。
代理访问控制：对内外部代理统一接入网关，落实密钥轮换、最小权限与动作审计，将 Scalekit 类方案纳入评估列表。
内容安全治理：建立敏感主题监测与水印策略，对高风险输出引入人工复核或二次确认对话，防范大规模信息操纵。
运行时补盲：针对 io_uring 盲点扩展 eBPF、kprobe 等监控手段，并检查运行时安全产品的版本更新情况。

工作清单

每季度安排一次第三方模型红队演练，覆盖越狱、数据投毒与注入链条。
对所有代理服务补齐身份与动作双向鉴权，输出访问矩阵文档。
对生成式内容发布链路执行水印与审计策略，并设置异常流量告警规则。
升级运行时探针，验证 io_uring 操作是否能被记录与阻断。

参考事件

SecurityWeek：《Irregular Raises $80 Million for AI Security Testing Lab》，2025-09-17。
SecurityWeek：《Scalekit Raises $5.5 Million to Secure AI Agent Authentication》，2025-09-17。
The Register：《Russian fake-news network…》，2025-09-18。
InfoQ：《Linux Security Tools Bypassed by io_uring Rootkit Technique, ARMO Research Reveals》，2025-09-16。

张显达

https://zhangxianda.com/2025/09/18/2025-09-18-ai-security-digest/

本博客所有文章除特別声明外，均采用 CC BY 4.0 许可协议。转载请注明来源张显达 !

模型防御供应链安全资金动向

上一篇

Java 25 LTS 上线带来的升级清单

Java 25 LTS 上线带来的升级清单

2025-09-18 Java

JDK25 性能优化企业升级

下一篇

2025年9月18日人工智能观察：多智能体生态重构

2025年9月18日人工智能观察：多智能体生态重构

2025-09-18 人工智能

多智能体模型评测 AI基础设施