人工智能 | 张显达的个人博客

概览

汇总近年的 AI 实践要点与资源导航：大语言模型（LLM）、RAG（检索增强）、函数/工具调用、智能体工作流、评测与安全，以及工程化与部署路径。

持续更新 · 推荐收藏本页

核心能力

大语言模型基础：上下文、温度/采样、系统提示、函数调用、工具使用。
RAG 设计：数据清洗/切片、Embedding、向量检索、重排、结构化回答。
智能体：多工具编排、计划与反馈、长时记忆、任务分解与验证。

开发与部署

API/SDK：OpenAI API、Anthropic、Google AI、Vercel AI SDK。
框架：LangChain、LlamaIndex；部署：vLLM、Ollama。
服务化：FastAPI、Ray、Modal。

检索与向量

数据库与插件：PostgreSQL + pgvector，Milvus，FAISS，Weaviate。
检索流程：索引构建、近似搜索、重排（Rerank）、答案组装与来源引用。

评测与安全

评测：任务导向评测、基准集、自动化回归，OpenAI Evals 等。
安全：越狱/提示注入防护、数据脱敏、输出约束与防幻觉策略。

精选资源

精选文章

                      
                      RAG 实战入门
                    
从零搭建检索增强生成：文档切分、Embedding、索引、检索、重排与引用。

                      智能体设计与多工具编排
                    
规划—执行—反馈回路、工具选择与调用、记忆与验证，在工程中的最佳实践。

                      评测与安全治理
                    
度量、回归、基准构建与越狱/提示注入防护，交付可控与合规的应用。

                      企业级 RAG 蓝图
                    
从数据治理到评测与安全的全链路架构与落地清单。

                      RAG 重排与评测
                    
召回优化、重排模型选择、指标体系与自动回归的深水区实践。

                      函数调用最佳实践
                    
工具协议设计、路由与回退、验证与安全、审计与可观测。

                      AI 安全：提示注入
                    
威胁模型、输入/上下文隔离、检测与输出约束、审计与响应。

AI 安全

                      
                      提示注入与越狱防护
                    
威胁模型、隔离与检测、输出约束与审计、上线门禁。

                      越狱检测与响应
                    
检测信号、自动化处置与复盘，构建闭环防御体系。

                      数据脱敏与权限控制
                    
分级脱敏、检索态 ACL/RLS、回答约束与可追溯。

                      输出合规与敏感检测
                    
PII/DLP 策略、输出约束与审计追责，合规可控。

                      Prompt 红队与基准集
                    
攻击样例采集、对抗生成、评分体系与回归基线。

                      工具调用安全
                    
凭据管理、权限最小化与审计留痕，保障工具安全。