张显达 zxd blog
RAG 数据脱敏与权限控制 RAG 数据脱敏与权限控制
1. 脱敏与分级字段级、模式级、上下文级脱敏;数据分级与访问策略。2. ACL 与 RLS检索阶段的权限过滤;数据库行级安全(RLS)配合 pgvector。3. 回答约束不可披露信息拒答;引用可追溯保障不越权。
2025-09-12
RAG 向量质量评估 RAG 向量质量评估
1. Embedding 选择与对比 通用/中文/领域模型对比;维度、速度与成本权衡。
2025-09-12
RAG 重排与评测深水区 RAG 重排与评测深水区
1. 召回的上限与数据质量 切分策略与重叠对召回的影响;去重/模板化清洗减少噪声。
2025-09-12
RAG 压缩与多文档组装 RAG 压缩与多文档组装
1. 片段压缩策略 语义压缩/提炼摘要;关键句抽取;去冗余合并。 图表/代码块
2025-09-12
RAG 实战入门:从零搭建检索增强生成 RAG 实战入门:从零搭建检索增强生成
RAG(Retrieval-Augmented Generation) 将“外部知识检索”与“生成式模型”结合,兼顾准确性与可追溯性,适用于企业知识库问答、报表问答、复杂检索答疑等场景。 一、
2025-09-12
提示注入与越狱防护 提示注入与越狱防护
1. 威胁模型 提示注入:用户输入/上下文中的恶意指令劫持系统目标。 越狱:诱
2025-09-12
大模型评测与安全治理入门 大模型评测与安全治理入门
评测是保障交付质量的第一道防线;安全治理是保障可控与合规的最后一道防线。两者共同构成生产级 AI 应用的“护城河”。 评测维度
2025-09-12
LLM 函数调用最佳实践 LLM 函数调用最佳实践
1. 工具协议设计 输入/输出 Schema、错误模型与幂等性;示例优先。 安
2025-09-12
企业级 RAG 蓝图:架构、实践与治理 企业级 RAG 蓝图:架构、实践与治理
1. 目标与边界 面向企业知识与流程的问答/助手,强调可追溯、可治理、可回归与低运维成本。
2025-09-12
智能体设计与多工具编排 智能体设计与多工具编排
智能体(Agent)是在给定目标下,能规划、调用工具、观测反馈并自我纠正的系统。本文聚焦工程中的可落地方案。 核心循环:计划—执行—反馈
2025-09-12
9 / 10