构建知识图谱
为您的知识库生成知识图谱。
为了增强多跳问答能力,RAGFlow 在数据提取和索引之间添加了知识图谱构建步骤,如下图所示。此步骤从通过您指定的分块方法生成的现有块中创建额外的块。
从 v0.16.0 开始,RAGFlow 支持在知识库上构建知识图谱,允许您在知识库内的多个文件中构建统一的图谱。当新上传的文件开始解析时,生成的图谱将自动更新。
警告
构建知识图谱需要大量的内存、计算资源和 token。
应用场景
知识图谱对于涉及嵌套逻辑的多跳问答特别有用。当您对具有复杂实体和关系的书籍或作品进行问答时,它们优于传统的提取方法。
提示
RAPTOR(树状组织检索的递归抽象处理)也可以用于多跳问答任务。详情请参阅启用 RAPTOR。您可以使用其中一种方法或两种方法都使用,但 请确保您了解所涉及的内存、计算和 token 成本。
前提条件
系统的默认聊天模型用于生成知识图谱。在继续之前,请确保您已正确配置了聊天模型:
配置
实体类型(必需)
从知识库中提取的实体类型。默认类型有:组织、人员、事件和类别。根据您的特定知识库添加或删除类型。
方法
用于构建知识图谱的方法:
实体解析
是否启用实体解析。您可以将其视为实体去重开关。启用后,LLM 将合并相似的实体 - 例如,'2025' 和 'the year of 2025',或 'IT' 和 'Information Technology' - 来构建更有效的图谱。
- (默认)禁用实体解析。
- 启用实体解析。此选项消耗更多 token。
社区报告生成
在知识图谱中,社区是通过关系连接的实体集群。您可以让 LLM 为每个社区生成摘要,称为社区报告。更多信息请参见此处。这表示是否生成社区报告:
- 生成社区报告。此选项消耗更多 token。
- (默认)不生成社区报告。
操作步骤
-
在知识库的配置页面上,开启提取知识图谱或根据需要调整其设置,然后点击保存确认更改。
- 现在已设置知识库的默认知识图谱配置,从此时起上传的文件将在解析期间自动使用这些设置。
- 在此更新之前解析的文件将保留其原始知识图谱设置。
-
知识库的知识图谱不会自动更新,直到新上传的文件被解析。
一旦创建了知识图谱,