张显达 zxd blog
越狱检测与响应流程 越狱检测与响应流程
1. 检测信号提示绕过、安全拒答失败、异常模式输出等。多级评分器:规则 + 小模型判别 + 人审抽样。2. 自动化处置降级/拒答;替换为安全模板;冻结会话。速率限制与黑名单;隔离高危来源。3. 复盘与改进样例沉淀为回归集;提示/工具/策略迭
2025-09-12
RAG 数据脱敏与权限控制 RAG 数据脱敏与权限控制
1. 脱敏与分级字段级、模式级、上下文级脱敏;数据分级与访问策略。2. ACL 与 RLS检索阶段的权限过滤;数据库行级安全(RLS)配合 pgvector。3. 回答约束不可披露信息拒答;引用可追溯保障不越权。
2025-09-12
RAG 重排与评测深水区 RAG 重排与评测深水区
1. 召回的上限与数据质量 切分策略与重叠对召回的影响;去重/模板化清洗减少噪声。
2025-09-12
RAG 实战入门:从零搭建检索增强生成 RAG 实战入门:从零搭建检索增强生成
RAG(Retrieval-Augmented Generation) 将“外部知识检索”与“生成式模型”结合,兼顾准确性与可追溯性,适用于企业知识库问答、报表问答、复杂检索答疑等场景。 一、
2025-09-12
RAG 压缩与多文档组装 RAG 压缩与多文档组装
1. 片段压缩策略 语义压缩/提炼摘要;关键句抽取;去冗余合并。 图表/代码块
2025-09-12
提示注入与越狱防护 提示注入与越狱防护
1. 威胁模型 提示注入:用户输入/上下文中的恶意指令劫持系统目标。 越狱:诱
2025-09-12
LLM 函数调用最佳实践 LLM 函数调用最佳实践
1. 工具协议设计 输入/输出 Schema、错误模型与幂等性;示例优先。 安
2025-09-12
大模型评测与安全治理入门 大模型评测与安全治理入门
评测是保障交付质量的第一道防线;安全治理是保障可控与合规的最后一道防线。两者共同构成生产级 AI 应用的“护城河”。 评测维度
2025-09-12
企业级 RAG 蓝图:架构、实践与治理 企业级 RAG 蓝图:架构、实践与治理
1. 目标与边界 面向企业知识与流程的问答/助手,强调可追溯、可治理、可回归与低运维成本。
2025-09-12
智能体设计与多工具编排 智能体设计与多工具编排
智能体(Agent)是在给定目标下,能规划、调用工具、观测反馈并自我纠正的系统。本文聚焦工程中的可落地方案。 核心循环:计划—执行—反馈
2025-09-12
13 / 14