概览
汇总近年的 AI 实践要点与资源导航:大语言模型(LLM)、RAG(检索增强)、函数/工具调用、智能体工作流、评测与安全,以及工程化与部署路径。
持续更新 · 推荐收藏本页
核心能力
- 大语言模型基础:上下文、温度/采样、系统提示、函数调用、工具使用。
- RAG 设计:数据清洗/切片、Embedding、向量检索、重排、结构化回答。
- 智能体:多工具编排、计划与反馈、长时记忆、任务分解与验证。
开发与部署
- API/SDK:OpenAI API、Anthropic、Google AI、Vercel AI SDK。
- 框架:LangChain、LlamaIndex;部署:vLLM、Ollama。
- 服务化:FastAPI、Ray、Modal。
检索与向量
- 数据库与插件:PostgreSQL + pgvector,Milvus,FAISS,Weaviate。
- 检索流程:索引构建、近似搜索、重排(Rerank)、答案组装与来源引用。
评测与安全
- 评测:任务导向评测、基准集、自动化回归,OpenAI Evals 等。
- 安全:越狱/提示注入防护、数据脱敏、输出约束与防幻觉策略。
精选资源
- OpenAI 文档 · OpenAI OpenAPI
- LangChain · LlamaIndex · vLLM
- pgvector · Milvus · Weaviate
精选文章

从零搭建检索增强生成:文档切分、Embedding、索引、检索、重排与引用。

规划—执行—反馈回路、工具选择与调用、记忆与验证,在工程中的最佳实践。

度量、回归、基准构建与越狱/提示注入防护,交付可控与合规的应用。

从数据治理到评测与安全的全链路架构与落地清单。

召回优化、重排模型选择、指标体系与自动回归的深水区实践。

工具协议设计、路由与回退、验证与安全、审计与可观测。

威胁模型、输入/上下文隔离、检测与输出约束、审计与响应。