加速索引
加速文档解析和索引的检查清单。
请注意,您的某些设置可能会消耗大量时间。如果您经常发现文档解析耗时过长,这里有一个需要考虑的检查清单:
- 使用 GPU 减少嵌入时间。
- 在知识库的配置页面上,关闭使用 RAPTOR 增强 检索。
- 提取知识图谱(GraphRAG)非常耗时。
- 在知识库的配置页面上禁用自动关键词和自动问题,因为它们都依赖于 LLM。
- v0.17.0+: 如果您知识库中的所有 PDF 都是纯文本,不需要 OCR(光学字符识别)、TSR(表格结构识别)或 DLA(文档布局分析)等 GPU 密集型处理,您可以在文档解析器下拉菜单中选择 Naive 而不是 DeepDoc 或其他耗时的大模型选项。这将大大减少文档解析时间。