检索组件
从指定数据集检索信息的组件。
场景
检索组件在大多数 RAG 场景中都是必不可少的,它从指定的知识库中提取信息,然后发送给 LLM 进行内容生成。从 v0.20.0 开始,检索组件可以作为工作流组件或智能体的工具运行,使智能体能够控制其调用和搜索查询。
配置
点击检索组件打开其配置窗口。
查询变量
必填
选择检索的查询源。
检索组件依赖查询变量来指定其数据输入(查询)。在检索组件之前定义的所有全局变量都可在下拉列表中使用。
知识库
选择要从中检索数据的知识库。
- 如果未选择知识库,意味着与智能体的对话将不基于任何知识库,请确保空响应字段保留为空以避免错误。
- 如果您选择多个知识库,您必须确保所选择的知识库(数据集)使用相同的嵌入模型;否则会出现错误消息。
相似度阈值
RAGFlow 在检索过程中采用加权关键词相似度和加权向量余弦相似度的组合。此参数设置用户查询与数据集中存储的块之间相似度的阈值。任何相似度分数低于此阈值的块都将从结果中排除。
默认值为 0.2。
关键词相似度权重
此参数设置关键词相似度在组合相似度分数中的权重。两个权重的总和必须等于 1.0。其默认值为 0.7,这意味着向量相似度在组合搜索中的权重为 1 - 0.7 = 0.3。
前 N 项
此参数从检索的块中选择"前 N 项"块并将它们提供给 LLM。
默认值为 8。
重排序模型
可选
如果选择了重排序模型,将使用加权关键词相似度和加权重排序分数的组合进行检索。
警告
使用重排序模型将显著增加系统的响应时间。
空响应
- 如果从知识库中未检索到查询结果,将此设置为响应,或者
- 将此字段留空以允许聊天模型在找不到任何内容时即兴发挥。
警告
如果您未指定知识库,您必须将此字段留空;否则会发生错误。
跨语言搜索
为跨语言搜索选择一种或多种语言。如果未选择语言,系统将使用原始查询进行搜索。
使用知识图谱
是否在检索过程中使用指定知识库中的知识图谱进行多跳问答。启用时,这将涉及跨实体、关系和社区报告块的迭代搜索,极大地增加检索时间。
输出
检索组件输出的全局变量名,可被工作流中的其他组件引用。