开始 AI 聊天

使用配置的聊天助手启动 AI 驱动的聊天。

知识库、无幻觉聊天和文件管理是 RAGFlow 的三大支柱。RAGFlow 中的聊天基于特定的知识库或多个知识库。一旦您创建了知识库、完成了文件解析并运行了检索测试，就可以开始 AI 对话了。

开始 AI 聊天

您通过创建助手来开始 AI 对话。

点击页面中上方的聊天选项卡 > 创建助手，显示您下一个对话的 聊天配置对话框。

RAGFlow 为您提供为每个对话选择不同聊天模型的灵活性，同时允许您在系统模型设置中设置默认模型。
更新助手设置：
- 助手名称是您聊天助手的名称。每个助手对应一个具有知识库、提示词、混合搜索配置和大模型设置唯一组合的对话。
- 空回复：
  - 如果您希望将 RAGFlow 的答案限制在您的知识库中，请在此处留下回复。然后，当它没有检索到答案时，它会统一回复您在此处设置的内容。
  - 如果您希望 RAGFlow 在没有从知识库中检索到答案时即兴发挥，请将其留空，这可能会产生幻觉。
- 显示引用：这是 RAGFlow 的关键功能，默认启用。RAGFlow 不像黑箱一样工作。相反，它清楚地显示其回复所基于的信息来源。
- 选择相应的知识库。您可以选择一个或多个知识库，但要确保它们使用相同的嵌入模型，否则会出现错误。
更新提示引擎：
- 在系统中，您为 LLM 填写提示词，开始时也可以保持默认提示词不变。
- 相似度阈值为每个文本块设置相似度"门槛"。默认值为 0.2。相似度分数较低的文本块将从最终回复中过滤出去。
- 关键词相似度权重默认设置为 0.7。RAGFlow 使用混合评分系统来评估不同文本块的相关性。此值设置混合评分中分配给关键词相似度组件的权重。
  - 如果重排模型留空，混合评分系统使用关键词相似度和向量相似度，分配给向量相似度组件的默认权重为 1-0.7=0.3。
  - 如果选择了重排模型，混合评分系统使用关键词相似度和重排评分，分配给重排评分的默认权重为 1-0.7=0.3。
- Top N 确定提供给 LLM 的块的最大数量。换句话说，即使检索到更多块，也只提供前 N 个块作为输入。
- 多轮优化使用多轮对话中的现有上下文增强用户查询。默认启用。启用后，它会消耗额外的 LLM token，并显著增加生成答案的时间。
- 使用知识图谱指示在检索期间是否在指定知识库中使用知识图谱进行多跳问答。启用后，这将涉及跨实体、关系和社区报告块的迭代搜索，大大增加检索时间。
- 推理指示是否通过 Deepseek-R1/OpenAI o1 等推理过程生成答案。启用后，聊天模型在问答过程中遇到未知主题时会自主集成深度研究。这涉及聊天模型动态搜索外部知识并通过推理生成最终答案。
- 重排模型设置要使用的重排模型。默认留空。
  - 如果重排模型留空，混合评分系统使用关键词相似度和向量相似度，分配给向量相似度组件的默认权重为 1-0.7=0.3。
  - 如果选择了重排模型，混合评分系统使用关键词相似度和重排评分，分配给重排评分的默认权重为 1-0.7=0.3。
- 跨语言搜索：可选
  从下拉菜单中选择一种或多种目标语言。系统的默认聊天模型将把您的查询翻译成选定的目标语言。这种翻译确保跨语言的准确语义匹配，允许您检索相关结果，无论语言差异。
  - 选择目标语言时，请确保这些语言存在于知识库中以保证有效搜索。
  - 如果没有选择目标语言，系统将只在您查询的语言中搜索，这可能会导致错过其他语言的相关信息。
- 变量是指在系统提示词中要使用的变量（键）。{knowledge} 是保留变量。点击添加为系统提示词添加更多变量。
  - 如果您不确定变量背后的逻辑，请保持原样。
  - 截至 v0.20.0，如果您在此处添加自定义变量，传入其值的唯一方法是调用：
    - HTTP 方法与聊天助手对话，或
    - Python 方法与聊天助手对话。
更新模型设置：
- 在模型中：您选择聊天模型。尽管您已在系统模型设置中选择了默认聊天模型，RAGFlow 允许您为对话选择替代聊天模型。
- 自由度：温度、Top P、存在惩罚和频率惩罚设置的快捷方式，指示模型的自由度级别。从即兴发挥、精确到平衡，每个预设配置对应温度、Top P、存在惩罚和频率惩罚的唯一组合。
  此参数有三个选项：
  - 即兴发挥：产生更有创意的回复。
  - 精确：（默认）产生更保守的回复。
  - 平衡：即兴发挥和精确之间的中间立场。
- 温度：模型输出的随机性级别。
  默认为 0.1。
  - 较低的值导致更确定性和可预测的输出。
  - 较高的值导致更有创意和多样的输出。
  - 零温度导致相同提示词产生相同输出。
- Top P：核采样。
  - 通过设置阈值 P 并将采样限制在累积概率超过 P 的 token，减少生成重复或不自然文本的可能性。
  - 默认为 0.3。
- 存在惩罚：鼓励模型在回复中包含更多样的 token。
  - 较高的存在惩罚值导致模型更可能生成尚未在生成文本中包含的 token。
  - 默认为 0.4。
- 频率惩罚：阻止模型在生成文本中过于频繁地重复相同单词或短语。
  - 较高的频率惩罚值导致模型在使用重复 token 时更加保守。
  - 默认为 0.7。
现在，让我们开始表演：