为什么值得关注
RAG 系统上线后,常见问题不是完全查不到,而是召回了一堆看起来相关、实际回答不了问题的片段。向量检索效果不稳定,会直接影响用户对 AI 知识库的信任。
落地路径
先用固定问题集记录期望命中的文档、段落和关键事实,再分别观察向量召回、关键词召回和混合检索结果。对高频问题可以调整切分粒度、TopK、相似度阈值和重排模型;对专有名词、版本号、错误码等内容,关键词检索往往比纯向量更可靠。
工程注意点
调优要保留每次实验的参数、样本、命中结果和失败案例,避免靠印象判断。线上可以收集用户点击、复制、追问和人工纠错信号,定期把失败问题补进评测集,形成可持续的反馈闭环。