跳到主要内容

设置页面排名

使用页面排名创建步骤检索策略。


应用场景

在AI驱动的聊天中,您可以配置聊天助手或智能体使用从多个指定知识库(数据集)检索的知识来响应,前提是它们使用相同的嵌入模型。在您希望来自某些知识库的信息优先或首先被检索的情况下,您可以使用RAGFlow的页面排名功能来增加来自这些知识库的片段的排名。例如,如果您配置了一个聊天助手从两个知识库中提取信息,知识库A用于2024年新闻,知识库B用于2023年新闻,但希望优先考虑2024年的新闻,这个功能特别有用。

注意

需要注意的是,这个"页面排名"功能在整个知识库级别运行,而不是针对单个文件或文档。

配置

在知识库的配置页面上,拖动页面排名下的滑块为您的知识库设置页面排名值。您也可以在滑块旁边的字段中输入目标页面排名值。

注意

页面排名值必须是整数。范围:[0,100]

  • 0:禁用(默认)
  • 特定值:启用
注意

如果您将页面排名值设置为非整数,比如1.7,它将向下舍入到最接近的整数,在这种情况下是1。

评分机制

如果您将聊天助手的相似度阈值配置为0.2,则只有混合评分大于0.2 x 100 = 20的片段才会被检索并发送给聊天模型进行内容生成。这个初始过滤步骤对于缩小相关信息范围至关重要。

如果您为知识库A(2024年新闻)分配了页面排名1,为知识库B(2023年新闻)分配了0,检索到的片段的最终混合评分将相应调整。从知识库A检索到的初始评分为50的片段将获得1 x 100 = 100点的提升,最终评分为50 + 1 x 100 = 150。这样,从知识库A检索到的片段将始终优先于知识库B的片段。