张显达 zxd blog
多模态智能的工程落地:检索对齐、反馈循环与成本护栏 多模态智能的工程落地:检索对齐、反馈循环与成本护栏
导语:多模态(文/图/表/音)模型快速升级,企业落地的核心是“可验证的检索对齐、可回溯的反馈循环、受控的成本护栏”。本文给出可操作的工程路线与核查清单。 1. 场景分级与策略 P0(安全/合规):人机
2026-01-20
企业级多模态智能落地:检索增强、评测基线与合规护栏 企业级多模态智能落地:检索增强、评测基线与合规护栏
导语:大模型进入多模态阶段,文本、图像、结构化数据联合推理成为主流需求。本文聚焦企业落地路径:检索增强 (RAG) 的数据与特征治理、多模态评测基线、风险与合规护栏,以及可复制的工程化流程。 1. 业务拆解与场景分级 典型场景:客服
2026-01-19
多模型Agent的安全运营:权限分层、可回放工作流与在线评测门禁 多模型Agent的安全运营:权限分层、可回放工作流与在线评测门禁
导语:近期多模型 Agent 被用于真实业务:售后自动化、内部助手、运营决策。然而,生产落地的痛点仍在:工具调用越权、工作流不可复现、评测缺失、成本与风险不可控。本文给出可执行方案:权限分层、可回放工作流、在线评测门禁、成本与风险护栏,并附
2026-01-18
企业级多模态RAG落地:数据分层、引用证据链与安全路由的实操路线 企业级多模态RAG落地:数据分层、引用证据链与安全路由的实操路线
导语:多模态(文本+图片/表格/音频)RAG 正在成为企业知识问答的新默认,但生产落地的难点并未减少:数据分层、引用可验证、权限与成本可控、跨模态评测缺失。本文给出可执行的多模态 RAG 落地方案:数据分层与版本化、引用
2026-01-16
可信AIOps助手落地:观测对话、自动化Runbook与安全门禁 可信AIOps助手落地:观测对话、自动化Runbook与安全门禁
导语:近期很多团队在尝试让大模型成为“运维副驾”。要把 AIOps 助手用在生产,难点不在“能不能回答”,而在“是否可验证、可审计、可控执行”。本文提供一套可执行方案:观测对话、自动化 Runbook、执行安全门禁、可验证评测,并附核查清单
2026-01-15
企业级多模型路由的可验证落地:策略分层、在线评测与成本护栏 企业级多模型路由的可验证落地:策略分层、在线评测与成本护栏
导语:多模型路由已成为企业 AI 应用的主流:不同场景用不同模型、不同成本档,甚至在同一请求中动态决策。难点在于:策略不可验证、质量难度量、成本难收敛、越权与数据泄露风险。本文给出可执行的落地方案:策略分层、在线评测、成本护栏、审计证据包,
2026-01-14
企业RAG的可验证交付:检索质量门禁、引用证据包与安全路由 企业RAG的可验证交付:检索质量门禁、引用证据包与安全路由
导语:当日与近期的 AI 讨论正从“能不能回答”转向“能否可验证地回答”。企业落地 RAG 的核心挑战是:检索质量无法保证、引用不可复核、跨域越权风险、成本与时延不可控。本文给出可执行的交付方案:检索质量门禁、引用证据包、权限与成本路由,并
2026-01-13
企业级Agent安全落地实践:工具分级、责任链审计与在线评测门禁 企业级Agent安全落地实践:工具分级、责任链审计与在线评测门禁
导语:近期AI应用进入“能执行”的阶段,企业关心的不再是“能不能回复”,而是“能否安全调用工具、可追责、可复现”。本文从工程视角给出一套可落地的Agent安全方案:工具分级授权、责任链审计、在线评测门禁,并附上可直接套用的SOP与检查表。
2026-01-09
Agent系统的生产化落地:安全工具调用、责任链与在线评测的闭环方法 Agent系统的生产化落地:安全工具调用、责任链与在线评测的闭环方法
导语:当日与近期的AI热度从“能写能画”转向“能执行”。Agent 能调用工具、触达真实系统,带来了巨大的效率,也带来越权、错误执行与不可追溯风险。要让 Agent 在生产中可控,必须把“安全工具调用、责任链记录、在线评测”做成默认能力。本
2026-01-07
可验证RAG落地:引用证据链、评测门禁与权限最小化实践 可验证RAG落地:引用证据链、评测门禁与权限最小化实践
导语:围绕“当日与近期热议的AI应用可信化”这个方向,企业落地的核心矛盾已经从“能不能答”转向“能不能被复核、可追责、可持续运营”。这类需求通常来自三股力量:合规与审计要求更细、业务线希望把AI接入真实权限与真实系统、以及成本压力迫使我们建
2026-01-04
3 / 16