1. Embedding 选择与对比
- 通用/中文/领域模型对比;维度、速度与成本权衡。
2. 质量指标
- 覆盖率@k、NDCG、MRR;标注样本与噪声控制。
3. 数据漂移与回归
- 数据/模型/切分变更的影响评估;双写与灰度。
RAG 重排与评测深水区
RAG 数据脱敏与权限控制