「召回(Retrieval)」这个词一般来自搜索系统或推荐系统的概念,例如在 Dify 中的应用也类似,用于从知识库中找到与用户问题相关的内容,作为大语言模型(LLM)回答问题的参考依据。
一句话解释:
召回是从知识库中筛选出与用户问题最相关的内容(文本片段),提供给模型用于更准确地生成回答。
更通俗的解释:
假设你在 Dify 中创建了一个「智能客服机器人」,并上传了产品手册作为知识库。
当用户问「你们的手机支持5G吗?」:
召回的过程:
- Dify 会先把用户的问题转成向量(语义理解),
- 然后在你上传的知识库中找出最相似的段落,比如“iPhone 15 Pro 支持 5G 网络”这一段,
- 这个过程就叫做「召回」。
接下来才是大模型生成回答:
- Dify 把这些被召回的段落+用户的问题一起发送给大模型,
- 让模型结合上下文生成更准确的回答。
在 Dify 中召回的相关术语可能包括:
术语 | 含义 |
---|---|
知识库召回 | 从知识库中找到与问题最相关的文本片段(上下文) |
向量召回 | 使用向量数据库(如 FAISS)来检索语义相似的内容 |
召回片段数 | 一次召回返回的段落数量,影响答案准确性和上下文长度 |
召回方式 | 可能支持 hybrid 检索、关键词检索、向量检索等 |
总结
在 Dify 中,召回是指把和用户问题最相关的知识从知识库中“拉”出来,作为回答问题时的参考依据。
它是「基于知识库问答」的关键一步,直接影响生成答案的准确性。