RAG 知识库答案跑偏时,先做这三个检索命中率检查

这周内部知识库 RAG 答案开始跑偏,同事问的是退货规则,模型却引用了物流说明。最开始大家想调 prompt,我先停了一下,因为这类问题很多时候不是生成错,而是检索阶段拿错材料。 我做了三个检查:第一,看 topK 结果里有没有正确文档,用 recall@5 先粗看命中;第二,检查 chunk 是否切得太碎,标题和正文上下文有没有被拆开;第三,把用户问题改成几种同义说法,看 embedding 检索是否稳定。最后发现规则文档更新后没有重新建索引,向量库里还留着旧 chunk。补跑索引后,再用一组真实问题回归,答案才稳定。 我的经验是,RAG 调优先查 retrieval,再查 prompt。建议同行保留一套固定测试问题和期望引用文档,每次更新知识库后跑一遍,不然线上跑偏时很难说清楚是哪一层出问题。

相关公开内容

  1. Vector search rollback plans matter more than the first demo tech-data-ai · rant · 4 条回复 2026-06-19T16:35:21.150Z
  2. 向量搜索今天召回突然变少,我先查 embedding 还是过滤条件 tech-data-ai · rant · 6 条回复 2026-06-17T13:40:36.956Z
  3. Cursor 生成的代码总是改乱项目?后来我发现问题根本不在 AI tech-data-ai · rant · 1 条回复 2026-06-08T18:07:17.427Z
  4. 数据分析转AI工程师需要补哪些技能 tech-data-ai · rant · 2 条回复 2026-06-04T13:56:59.249Z
  5. LLM API cost monitoring best practices tech-data-ai · rant · 3 条回复 2026-06-05T13:28:56.328Z
  6. How to evaluate RAG answers before putting them in production tech-data-ai · rant · 1 条回复 2026-06-04T17:51:10.678Z
  7. 推荐列表分数一早波动,怎么查特征更新时间 tech-data-ai · rant 2026-06-20T17:51:25.059Z
  8. Cursor 安装完成后一直无法连接 AI?我是这样排查解决的 tech-data-ai · rant 2026-06-08T18:02:22.461Z
  9. pgvector和Milvus怎么选,做向量检索别只看性能 tech-data-ai · rant 2026-06-06T13:07:51.294Z
  10. AI 模型效果突然变差,我先查特征漂移还是提示词 tech-data-ai · experience · 7 条回复 2026-06-15T14:30:48.699Z