加速问答
加速问答的检查清单。
请注意,您的某些设置可能会消耗大量时间。如果您经常发现问答过程耗时过长,这里有一个需要考虑的检查清单:
- 在聊天配置对话框的提示引擎选项卡中,禁用多轮优化将减少从 LLM 获取答案所需的时间。
- 在聊天配置对话框的提示引擎选项卡中,将重排模型字段留空将显著减少检索时间。
- 使用重排模型时,确保您有 GPU 加速;否则,重排过程将极其缓慢。
提示
请注意,重排模型在某些场景中是必需的。速度和性能之间总是存在权衡;您必须根据您的具体情况权衡利弊。
- 在聊天配置对话框的助手设置选项卡中,禁用关键词分析将减少从 LLM 接收答案的时间。
- 与您的聊天助手聊天时,点击当前对话上方的灯泡图标并向下滚动弹出窗口以查看每个任务所用的时间:
| 项目名称 | 描述 |
|---|---|
| 总计 | 此轮对话总耗时,包括块检索和答案生成。 |
| 检查 LLM | 验证指定 LLM 的时间。 |
| 创建检索器 | 创建块检索器的时间。 |
| 绑定嵌入 | 初始化嵌入模型实例的时间。 |
| 绑定 LLM | 初始化 LLM 实例的时间。 |
| 调优问题 | 使用多轮对话上下文优化用户查询的时间。 |
| 绑定重排器 | 初始化块检索的重排模型实例的时间。 |
| 生成关键词 | 从用户查询中提取关键词的时间。 |
| 检索 | 检索块的时间。 |
| 生成答案 | 生成答案的时间。 |