导语:
围绕“当日与近期热议的AI应用可信化”这个方向,企业落地的核心矛盾已经从“能不能答”转向“能不能被复核、可追责、可持续运营”。这类需求通常来自三股力量:合规与审计要求更细、业务线希望把AI接入真实权限与真实系统、以及成本压力迫使我们建立稳定的评测与门禁体系。本文给出一套可复用的落地方法:把 RAG 做成“可验证的引用证据链”,把上线做成“评测门禁”,把工具调用做成“权限最小化”。
1. 先统一目标:你要验证什么
常见“可信”目标至少包含四类,可直接写进验收清单:
- 可复核:回答中的关键结论能指向可验证的证据片段(文档、表格、工单、政策条款)。
- 可控权:模型不能越权读数据、不能越权写系统(尤其是工单/支付/配置/用户信息)。
- 可度量:检索命中率、引用覆盖率、幻觉率、成本与时延能被持续观测。
- 可回放:对同一输入,在相同版本的知识库、提示与路由策略下可重现输出(便于审计与复盘)。
把这四类目标落成指标,你就得到一张“门禁表”(示例):
- 引用覆盖率 ≥ 90%(包含至少 2 条来源,且覆盖所有关键结论)
- 无引用断言率 ≤ 3%
- 越权访问事件 = 0(基于权限审计日志)
- P95 时延 ≤ 4s;单次推理成本 ≤ 设定阈值
2. 架构最小闭环:证据链 + 门禁 + 权限
推荐用“三件套”来约束系统行为:
2.1 证据链(Evidence Pack)
每次回答都产出一份可保存、可检索的“证据包”,至少包含:
kb_version:知识库版本/索引版本(支持回滚)prompt_version:提示/策略版本(支持回放)retrieval:召回结果(文档ID、片段ID、分数、时间戳)citations:引用映射(回答段落 -> 证据片段)policy:权限与路由策略(调用了哪些工具、用什么范围的凭证)eval:在线评测结果(覆盖率、无引用断言、拒答率、成本)
你可以把证据包保存成 JSON(或写入日志系统/对象存储),并在前端“引用悬浮卡”中展示来源片段与元数据。
2.2 评测门禁(Evals Gate)
上线不是一次性动作,而是持续门禁:
- 离线:基准集(FAQ/政策问答/流程问答)每日回归。
- 灰度:小流量 + 影子评测(不影响用户,但记录输出)。
- 在线:关键指标触发自动降级(切到更保守的提示、缩小工具权限、或只读模式)。
2.3 权限最小化(Least Privilege)
工具调用不要直接给“全能 token”。建议:
- 读与写分离:读数据用只读凭证;写操作必须二次确认或人审。
- 按“动作”发证:例如“创建工单”与“修改配置”是两种动作,两种不同权限。
- 按“范围”发证:租户/项目/区域/时间窗限制,避免横向移动。
3. 操作流程:把RAG做成可验证系统(可照抄)
下面是一套能在 1~2 周内落地的工程流程。
3.1 数据与切分:先保证可追溯
- 先做目录级“数据台账”:数据源、责任人、更新时间、敏感级别、使用范围。
- 每次采集生成
source_snapshot_id(例如 git commit、对象存储版本号)。 - 切分策略要可解释:按标题/段落/列表/表格分块;对表格保留行列头;对代码保留语言与文件路径。
- 生成
chunk_id:doc_id + section + offset,后续引用靠它定位。
3.2 检索与重排:把“为什么召回它”记录下来
建议每次检索记录两段数据:
- 召回:向量/关键词/混合召回的 topK 结果与分数
- 重排:重排模型输出的排序与理由(可选)
这样你在复盘“答错了”为何错时,有证据链可查:是没召回、召回了没重排上来、还是生成阶段编造。
3.3 生成与引用:强制“先证据后结论”
提示层面建议做两条硬规则:
- 结论必须带引用:每个关键结论后面附
[doc:chunk]风格的标记。 - 无证据就拒答:当召回置信度不足或证据缺失时,返回“我需要更多信息/请提供文档链接”。
工程层面建议:
- 在渲染前做一次“引用校验”:若回答段落没有任何引用标记,直接降级/重试。
- 在输出前做“断言抽取”:抽取名词实体与数值断言,检查是否都被引用覆盖。
4. 评测门禁怎么做得“便宜且稳定”
很多团队评测做不起来,原因不是不会算分,而是流程太重。一个轻量但有效的方案是:
- 三层样本池:高频问题(每天回归)+ 关键流程题(每周回归)+ 长尾抽样(在线采样)。
- 两类指标:业务正确性(人工/半自动标注)+ 可信指标(引用覆盖、无引用断言、拒答合理性)。
- 一个止损开关:当无引用断言率上升或越权事件出现,立即切换到“只读+严格拒答”策略。
5. 最终交付物:把“干货”做成模板
建议把下面这些作为你对业务方的交付物(能显著提升参考价值):
- 《证据包字段规范》(json schema + 示例)
- 《评测集管理规范》(新增样本流程、标注口径、版本号、回归频率)
- 《权限矩阵》(动作/范围/审计字段/紧急开关)
- 《上线门禁表》(阈值、负责人、回滚步骤)
风险提示(必须提前讲清)
- 引用并不等于正确:引用覆盖率高也可能“引用错片段”,所以要做“引用一致性抽检”。
- 合规的边界在数据:知识库入库前必须做脱敏与授权,否则再强的权限也挡不住“训练/提示泄漏”风险。
- 成本在重排与多轮:把重排与重试当成预算项管理,必要时对不同用户/场景做路由分层。
结语
把RAG做成“可验证系统”的关键,不是堆更多模型,而是把证据链、门禁和权限做成默认。你一旦把“证据包”跑通,后续优化就有抓手:答错了能定位,成本飙了能止损,合规审计也能自证清白。