RAG知识库不能只看“有没有回答”,更要看回答是否来自正确资料、是否引用来源、是否遵守权限,以及遇到无资料问题时是否诚实拒答。
用真实问题集测试是否能召回正确文档片段,排查资料切分、标签和召回参数问题。
评估答案是否准确、完整、引用来源清晰,是否存在编造、混淆或过度概括。
持续跟踪无答案问题、低满意度回答和高频查询,把反馈转化为知识库更新任务。
智灵科技可在知识库交付中提供评测表、测试问题集和持续优化机制。
RAG评测 知识库准确率 来源追溯 企业知识库