跳到主要内容

版本发布

最新版本中的关键功能、改进和错误修复。

信息

每个 RAGFlow 版本都有两个版本:

  • 精简版:不包含内置嵌入模型,版本名称带有 -slim 后缀。示例:infiniflow/ragflow:v0.19.1-slim
  • 完整版:包含内置嵌入模型,版本名称没有后缀。示例:infiniflow/ragflow:v0.19.1
重要

完整版中包含的嵌入模型有:

  • BAAI/bge-large-zh-v1.5
  • maidalun1020/bce-embedding-base_v1

这两个嵌入模型专门为英文和中文优化,因此如果您使用它们嵌入其他语言的文档,性能可能会受到影响。

v0.20.0

发布于 2025 年 8 月 4 日。

兼容性变更

从 v0.20.0 开始,智能体与早期版本不再兼容,升级后必须重新构建之前版本的所有现有智能体。

新功能

  • 智能体和工作流的统一编排。
  • 对智能体进行全面重构,大大增强其功能和可用性,支持多智能体配置、规划和反思以及可视化功能。
  • 完全实现 MCP 功能,允许导入 MCP 服务器、智能体作为 MCP 客户端运行,以及 RAGFlow 本身作为 MCP 服务器运行。
  • 可以访问智能体的运行时日志。
  • 通过管理面板提供智能体聊天历史记录。
  • 集成新的更强大版本的 Infinity,以 Infinity 作为底层文档引擎启用自动标签功能。
  • 支持文件引用信息的 OpenAI 兼容 API。
  • 支持新的嵌入模型,包括 Kimi K2、Grok 4 和 Voyage。
  • RAGFlow 的代码库现在在 Gitee 上镜像。
  • 引入新的模型提供商 Gitee AI。

引入的新智能体模板

  • 基于多智能体的深度研究:由主智能体和多个子智能体协作的智能体团队合作,不同于传统的工作流编排。
  • 利用内部知识库的智能问答聊天机器人,为客服和培训场景设计。
  • RAGFlow 团队用于筛选、分析和记录候选人信息的简历分析模板。
  • 将原始想法转化为 SEO 友好博客内容的博客生成工作流。
  • 智能客服工作流。
  • 通过语义分析将用户反馈定向到适当团队的用户反馈分析模板。
  • 旅行规划器:使用网络搜索和地图 MCP 服务器协助旅行规划。
  • 图片翻译:翻译上传照片中的内容。
  • 从内部知识库和网络检索答案的信息搜索助手。

v0.19.1

发布于 2025 年 6 月 23 日。

修复问题

  • 高并发请求期间的内存泄漏问题。
  • 启用 GraphRAG 实体解析时大文件解析冻结。#8223
  • 在独立模式下使用 Sandbox 时出现上下文错误。#8340
  • Ollama 导致的 CPU 使用率过高问题。#8216
  • 代码组件中的错误。#7949
  • 通过 API 创建知识库时添加了对通过 Ollama 或 VLLM 安装的模型的支持。#8069
  • 为 S3 存储桶访问启用基于角色的认证。#8149

新增模型

  • Qwen 3 Embedding。#8184
  • Voyage Multimodal 3。#7987

v0.19.0

发布于 2025 年 5 月 26 日。

新功能

  • 知识库和聊天模块支持跨语言搜索,增强多语言环境中的搜索准确性和用户体验,例如在中英文知识库中。
  • 智能体组件:新的代码组件支持 Python 和 JavaScript 脚本,使开发人员能够处理更复杂的任务,如动态数据处理。
  • 增强图像显示:聊天和搜索中的图像现在直接在回复中渲染,而不是作为外部引用。知识检索测试可以直接检索图像,而不是从图像中提取的文本。
  • Claude 4 和 ChatGPT o3:开发人员现在可以使用新发布的最先进的 Claude 模型和 OpenAI 最新的 ChatGPT o3 推理模型。

以下功能由我们的社区贡献:

  • 智能体组件:在生成组件内启用工具调用。感谢 notsyncing
  • Markdown 渲染:markdown 文件中的图像引用可以在分块后显示。感谢 Woody-Hu
  • 文档引擎支持:现在可以使用 OpenSearch 作为 RAGFlow 的文档引擎。感谢 pyyuhao

文档

新增文档

v0.18.0

发布于 2025 年 4 月 23 日。

兼容性变更

从此版本开始,内置重排模型已被移除,因为它们对检索率影响很小,但会显著增加检索时间。

新功能

  • MCP 服务器:支持通过 MCP 访问 RAGFlow 的知识库。
  • DeepDoc 支持在文档布局识别期间采用 VLM 模型作为处理管道,实现对 PDF 和 DOCX 文件中图像的深度分析。
  • OpenAI 兼容 API:智能体可以通过 OpenAI 兼容 API 调用。
  • 用户注册控制:管理员可以通过环境变量启用或禁用用户注册。
  • 团队协作:智能体可以与团队成员共享。
  • 智能体版本控制:所有更新都会持续记录,可以通过导出回滚到之前的版本。

export_agent

改进

  • 增强答案引用:生成响应中的引用准确性得到改善。
  • 增强问答体验:用户现在可以在对话过程中手动停止流式输出。

文档

新增文档

v0.17.2

发布于 2025 年 3 月 13 日。

兼容性变更

  • 聊天配置中移除了 Max_tokens 设置。
  • 生成重写分类关键词智能体组件中移除了 Max_tokens 设置。

从此版本开始,如果您仍然看到 RAGFlow 的响应被截断或缩短,请检查您的模型提供商的 Max_tokens 设置。

改进

  • 添加了 OpenAI 兼容 API。
  • 引入了德语用户界面。
  • 加速了知识图谱提取。
  • 检索智能体组件中启用了基于 Tavily 的网络搜索。
  • 添加了通义千问 QwQ 模型(OpenAI 兼容)。
  • 通用分块方法中支持 CSV 文件。

修复问题

  • 无法通过 Ollama/Xinference 添加模型,这是 v0.17.1 中引入的问题。

相关 API

HTTP API

Python API

v0.17.1

发布于 2025 年 3 月 11 日。

改进

  • 改善了英文标记化质量。
  • 改进了 Markdown 文档解析中的表格提取逻辑。
  • 更新了 SiliconFlow 的模型列表。
  • 支持解析 XLS 文件(Excel 97-2003)并改进了相应的错误处理。
  • 支持 Huggingface 重排模型。
  • 在聊天助手和重写智能体组件中启用了相对时间表达式("现在"、"昨天"、"上周"、"明年"等)。

修复问题

  • 重复的知识图谱提取问题。
  • API 调用问题。
  • PDF 解析器(即文档解析器)下拉菜单中选项缺失的问题。
  • Tavily 网络搜索问题。
  • 无法在 AI 聊天中预览图表或图像的问题。

文档

新增文档

v0.17.0

发布于 2025 年 3 月 3 日。

新功能

  • AI 聊天:为智能体推理实现了深度研究功能。要激活此功能,请在聊天助手对话框的提示引擎标签页下启用推理开关。
  • AI 聊天:利用基于 Tavily 的网络搜索来增强智能体推理中的上下文。要激活此功能,请在聊天助手对话框的助手设置标签页下输入正确的 Tavily API 密钥。
  • AI 聊天:支持在不指定知识库的情况下开始聊天。
  • AI 聊天:除了 PDF 文件外,HTML 文件也可以预览和引用。
  • 数据集:在数据集配置中添加了PDF 解析器(即文档解析器)下拉菜单。这包括一个 DeepDoc 模型选项(耗时较长)、一个更快的naive选项(纯文本),跳过 DLA(文档布局分析)、OCR(光学字符识别)和 TSR(表格结构识别)任务,以及几个当前为实验性的大模型选项。详见这里
  • 智能体组件:可以在生成模板组件的系统提示字段中使用 (x) 或正斜杠 / 来插入可用的键(变量)。
  • 对象存储:支持使用阿里云 OSS(对象存储服务)作为文件存储选项。
  • 模型:更新了通义千问(Qwen)的支持模型列表,添加了 DeepSeek 特定模型;添加了 ModelScope 作为模型提供商。
  • API:文档元数据可以通过 API 进行更新。

以下图表说明了 RAGFlow 深度研究的工作流程:

Image

以下是集成深度研究的对话截图:

Image

相关 API

HTTP API

更新文档方法添加了请求体参数 "meta_fields"

Python API

更新文档方法添加了键选项 "meta_fields"

文档

新增文档

v0.16.0

发布于 2025 年 2 月 6 日。

新功能

  • 支持 DeepSeek R1 和 DeepSeek V3。
  • GraphRAG 重构:知识图谱是在整个知识库(数据集)上动态构建,而非在单个文件上,并在新上传的文件开始解析时自动更新。详见这里
  • 添加了迭代智能体组件和研究报告生成器智能体模板。详见这里
  • 新增 UI 语言:葡萄牙语。
  • 允许为知识库中的特定文件设置元数据,以增强 AI 驱动的聊天。详见这里
  • 将 RAGFlow 的文档引擎 Infinity 升级至 v0.6.0.dev3。
  • 支持 DeepDoc 的 GPU 加速(参见 docker-compose-gpu.yml)。
  • 支持创建和引用标签知识库,这是弥合查询和响应之间语义差距的关键里程碑。
重要

标签知识库功能在 Infinity 文档引擎上不可用

文档

新增文档

v0.15.1

发布于 2024 年 12 月 25 日。

升级

  • 将 RAGFlow 的文档引擎 Infinity 升级至 v0.5.2。
  • 增强了文档解析状态的日志显示。

修复问题

此版本修复了以下问题:

  • Infinity 返回的 SCORE not foundposition_int 错误。
  • 一旦特定知识库中的嵌入模型被更改,其他知识库中的嵌入模型就无法再更改。
  • 由于重复加载嵌入模型导致的问答和 AI 搜索响应缓慢。
  • 使用 RAPTOR 解析文档失败。
  • 使用表格解析方法导致信息丢失。
  • 各种 API 问题。

相关 API

HTTP API

为以下 API 添加了可选参数 "user_id"

v0.15.0

发布于 2024 年 12 月 18 日。

新功能

  • 引入了额外的智能体专用 API。
  • 支持使用页面排名分数来改善跨多个知识库搜索时的检索性能。
  • 在聊天和智能体中提供 iframe,以便于将 RAGFlow 集成到您的网页中。
  • 添加了在 Kubernetes 上部署 RAGFlow 的 Helm 图表。
  • 支持以 JSON 格式导入或导出智能体。
  • 支持智能体组件/工具的步骤运行。
  • 添加了新的 UI 语言:日语。
  • 支持从故障中恢复 GraphRAG 和 RAPTOR,增强任务管理弹性。
  • 添加了更多 Mistral 模型。
  • 为 UI 添加了暗色模式,允许用户在浅色和深色主题之间切换。

改进

  • 升级了 DeepDoc 中的文档布局分析模型。
  • 在使用 Infinity 作为文档引擎时显著提高了检索性能。

相关 API

HTTP API

Python API

v0.14.1

发布于 2024 年 11 月 29 日。

改进

添加了 Infinity 的配置文件,以便于将 Infinity 作为文档引擎进行集成和自定义。从此版本开始,可以直接在 RAGFlow 内部对 Infinity 的配置进行更新,并在使用 docker compose 重启 RAGFlow 后立即生效。#3715

修复问题

此版本修复了以下问题:

  • 点击块后无法显示或编辑块内容。
  • Elasticsearch 中的 'Not found' 错误。
  • 中文文本在解析过程中乱码。
  • 与 Polars 的兼容性问题。
  • Infinity 和 GraphRAG 之间的兼容性问题。

v0.14.0

发布于 2024 年 11 月 26 日。

新功能

  • 支持使用 Infinity 或 Elasticsearch(默认)作为矢量存储和全文索引的文档引擎。#2894
  • 通过为智能体添加更多变量和实现自动保存来增强用户体验。
  • 添加了三步翻译智能体模板,受 Andrew Ng 的翻译智能体启发。
  • 添加了 SEO 优化的博客写作智能体模板。
  • 提供了用于与智能体对话的 HTTP 和 Python API。
  • 支持在检索过程中使用英语同义词。
  • 优化术语权重计算,将检索时间减少 50%。
  • 通过额外的性能指标改进任务执行器监控。
  • 用 Valkey 替换 Redis。
  • 添加了三种新的 UI 语言(由社区贡献):印尼语、西班牙语和越南语。

兼容性变更

从此版本开始,service_config.yaml.template 取代了 service_config.yaml 来配置后端服务。在 Docker 容器启动时,此模板文件中定义的环境变量会自动填充,并从中自动生成 service_config.yaml#3341

这种方法消除了在对 .env 进行更改后手动更新 service_config.yaml 的需要,促进了动态环境配置。

重要

在尝试这种新方法之前,请确保您将代码 Docker 镜像升级到此版本

相关 API

HTTP API

Python API

文档

新增文档

v0.13.0

发布于 2024 年 10 月 31 日。

新功能

  • 为所有用户添加了团队管理功能。
  • 更新了智能体 UI 以提高可用性。
  • 通用分块方法中添加了对 Markdown 分块的支持。
  • 在智能体 UI 中引入了调用工具。
  • 集成了对 Dify 知识库 API 的支持。
  • 添加了对 GLM4-9B 和 Yi-Lightning 模型的支持。
  • 引入了用于数据集管理、数据集内文件管理和聊天助手管理的 HTTP 和 Python API。
注意

要下载 RAGFlow 的 Python SDK:

pip install ragflow-sdk==0.13.0

文档

新增文档

v0.12.0

发布于 2024 年 9 月 30 日。

新功能

  • 提供了 RAGFlow Docker 镜像的精简版本,不包括内置的 BGE/BCE 嵌入或重排模型。
  • 改善了多轮对话的结果。
  • 允许用户删除已添加的 LLM 供应商。
  • 添加了对 OpenTTSSparkTTS 模型的支持。
  • 通用分块方法中实现了 Excel 转 HTML 切换,允许用户将电子表格解析为 HTML 表格或按行的键值对。
  • 添加了智能体工具 YahooFinanceJin10
  • 添加了投资顾问智能体模板。

兼容性变更

从此版本开始,RAGFlow 提供其 Docker 镜像的精简版本,以改善网络访问受限用户的体验。RAGFlow Docker 镜像的精简版本不包括内置的 BGE/BCE 嵌入模型,大小约为 1GB;完整版 RAGFlow 约 9GB,包括内置嵌入模型和在 RAGFlow UI 中选择时会下载的嵌入模型。

默认 Docker 镜像版本为 nightly-slim。以下列表说明了各版本之间的差异:

  • nightly-slim:最新测试 Docker 镜像的精简版本。
  • v0.12.0-slim:最新正式发布 Docker 镜像的精简版本。
  • nightly:最新测试 Docker 镜像的完整版本。
  • v0.12.0:最新正式发布 Docker 镜像的完整版本。

有关升级说明,请参见升级 RAGFlow

文档

新增文档

v0.11.0

发布于 2024 年 9 月 14 日。

新功能

  • 在 RAGFlow UI 中引入了 AI 搜索界面。
  • 支持通过 FishAudio通义千问 TTS 输出音频。
  • 除了 MySQL 外,还允许使用 Postgres 进行元数据存储。
  • 支持使用 S3 或 Azure Blob 的对象存储选项。
  • 支持模型供应商:AnthropicVoyage AIGoogle Cloud
  • 支持使用腾讯云 ASR 进行音频内容识别。
  • 添加了金融特定的智能体组件:问财AkShareYahooFinanceTuShare
  • 添加了医疗顾问智能体模板。
  • 支持在以下数据集上运行检索基准测试:

v0.10.0

发布于 2024 年 8 月 26 日。

新功能

  • 在智能体 UI 中引入了文本转 SQL 模板。
  • 实现了智能体 API。
  • 为任务执行器纳入了监控功能。
  • 引入了智能体工具 GitHubDeepL百度翻译和风天气GoogleScholar
  • 支持 EML 文件的分块。
  • 支持更多 LLM 或模型服务:GPT-4o-miniPerfXCloudTogetherAIUpstageNovita AI01.AISiliconFlowPPIO讯飞星火百度一言腾讯混元

v0.9.0

发布于 2024 年 8 月 6 日。

新功能

  • 支持将 GraphRAG 作为分块方法。
  • 引入了智能体组件关键词和搜索工具,包括百度DuckDuckGoPubMed维基百科必应谷歌
  • 支持音频文件的语音转文本识别。
  • 支持模型供应商 GeminiGroq
  • 支持推理框架、引擎和服务,包括 LM studioOpenRouterLocalAINvidia API
  • 支持在 Xinference 中使用重排模型。

v0.8.0

发布于 2024 年 7 月 8 日。

新功能

  • 支持 Agentic RAG,允许为 RAG 和智能体构建基于图的工作流。
  • 支持模型供应商 MistralMiniMaxBedrockAzure OpenAI
  • 在 MANUAL 分块方法中支持 DOCX 文件。
  • 在问答分块方法中支持 DOCX、MD 和 PDF 文件。

v0.7.0

发布于 2024 年 5 月 31 日。

新功能

  • 支持使用重排模型。
  • 集成重排和嵌入模型:BCEBGEJina
  • 支持 LLM 百川和火山方舟。
  • 实现了 RAPTOR 以改善文本检索。
  • 在通用分块方法中支持 HTML 文件。
  • 提供了按 ID 删除文档的 HTTP 和 Python API。
  • 支持 ARM64 平台。
重要

虽然我们也在 ARM64 平台上测试 RAGFlow,但我们不维护 ARM 的 RAGFlow Docker 镜像。

如果您使用的是 ARM 平台,请按照此指南构建 RAGFlow Docker 镜像。

相关 API

HTTP API

Python API

v0.6.0

发布于 2024 年 5 月 21 日。

新功能

  • 支持流式输出。
  • 提供了用于检索文档块的 HTTP 和 Python API。
  • 支持监控系统组件,包括 Elasticsearch、MySQL、Redis 和 MinIO。
  • 支持在通用分块方法中禁用布局识别以减少文件分块时间。

相关 API

HTTP API

Python API

v0.5.0

发布于 2024 年 5 月 8 日。

新功能

  • 支持 LLM DeepSeek。