张显达 zxd blog
企业级多模型路由的可验证落地:策略分层、在线评测与成本护栏 企业级多模型路由的可验证落地:策略分层、在线评测与成本护栏
导语:多模型路由已成为企业 AI 应用的主流:不同场景用不同模型、不同成本档,甚至在同一请求中动态决策。难点在于:策略不可验证、质量难度量、成本难收敛、越权与数据泄露风险。本文给出可执行的落地方案:策略分层、在线评测、成本护栏、审计证据包,
2026-01-14
企业RAG的可验证交付:检索质量门禁、引用证据包与安全路由 企业RAG的可验证交付:检索质量门禁、引用证据包与安全路由
导语:当日与近期的 AI 讨论正从“能不能回答”转向“能否可验证地回答”。企业落地 RAG 的核心挑战是:检索质量无法保证、引用不可复核、跨域越权风险、成本与时延不可控。本文给出可执行的交付方案:检索质量门禁、引用证据包、权限与成本路由,并
2026-01-13
企业级Agent安全落地实践:工具分级、责任链审计与在线评测门禁 企业级Agent安全落地实践:工具分级、责任链审计与在线评测门禁
导语:近期AI应用进入“能执行”的阶段,企业关心的不再是“能不能回复”,而是“能否安全调用工具、可追责、可复现”。本文从工程视角给出一套可落地的Agent安全方案:工具分级授权、责任链审计、在线评测门禁,并附上可直接套用的SOP与检查表。
2026-01-09
Agent系统的生产化落地:安全工具调用、责任链与在线评测的闭环方法 Agent系统的生产化落地:安全工具调用、责任链与在线评测的闭环方法
导语:当日与近期的AI热度从“能写能画”转向“能执行”。Agent 能调用工具、触达真实系统,带来了巨大的效率,也带来越权、错误执行与不可追溯风险。要让 Agent 在生产中可控,必须把“安全工具调用、责任链记录、在线评测”做成默认能力。本
2026-01-07
可验证RAG落地:引用证据链、评测门禁与权限最小化实践 可验证RAG落地:引用证据链、评测门禁与权限最小化实践
导语:围绕“当日与近期热议的AI应用可信化”这个方向,企业落地的核心矛盾已经从“能不能答”转向“能不能被复核、可追责、可持续运营”。这类需求通常来自三股力量:合规与审计要求更细、业务线希望把AI接入真实权限与真实系统、以及成本压力迫使我们建
2026-01-04
以证据为中心的AI交付:可核验引用、预算路由与可审计协作 以证据为中心的AI交付:可核验引用、预算路由与可审计协作
导语:近期 AI 应用的主线不再是“能不能生成”,而是“能不能长期可靠地交付”。企业落地进入深水区后会同时遇到三类问题:其一,回答看似合理但不可复核,导致信任成本陡增;其二,工具调用与权限边界不清,把风险从“答错”升级为“做错”;其三,推理
2026-01-03
AI走向关键链路:证据链、权限执行与预算化运营的系统方法 AI走向关键链路:证据链、权限执行与预算化运营的系统方法
导语:当日与近期关于 AI 的行业动态显示,AI 正在从“增强工具”走向“关键链路参与者”:它开始参与审批、运营、客服、研发与数据分析等高影响流程。与此同时,企业对 AI 的要求也从“能回答”升级为“能被信任”:输出可复核、动作可控、变更可
2025-12-31
可信多代理系统落地:证据链、权限边界与成本路由的工程闭环 可信多代理系统落地:证据链、权限边界与成本路由的工程闭环
导语:当日与近期科技新闻对 AI 的叙事正在发生转向:从“模型更强”转向“系统更可控”。企业真正要解决的不是生成能力,而是生产可用性:多代理协同带来更强自动化,但也带来审计与责任链难题;RAG 能接入企业知识,却容易出现不可复核的“引用漂移
2025-12-30
可信AI的工程化落地:引用链、权限边界与评测门禁的三层体系 可信AI的工程化落地:引用链、权限边界与评测门禁的三层体系
导语:当日与近期科技新闻对 AI 落地的讨论,正在从“能力展示”转向“可信交付”。企业真正担心的不是模型会不会写,而是:生成内容能否被复核、系统是否会越权调用工具、上线后是否会回归与漂移。要让 AI 进入关键业务链路,必须把可信做成工程体系
2025-12-29
数据边界、代理编排与可验证输出:企业AI进入深水区的落地方法 数据边界、代理编排与可验证输出:企业AI进入深水区的落地方法
导语:当日与近期的科技动态共同揭示了一个现实:AI 落地的瓶颈越来越少是“模型够不够大”,越来越多是“系统是否可控”。企业在深水区会同时遭遇三类问题:数据边界不清导致合规与越权风险;代理编排带来更强自动化但也更难审计;RAG 与生成输出若不
2025-12-28
1 / 14