最近在梳理 RAG 相关的开源项目时,发现了一个来自清华 THUNLP、东北大学 NEUIR 等机构联合推出的项目——UltraRAG。

它采用了一种相对创新的架构思路:将 RAG 系统的核心组件标准化为 MCP Server,通过声明式的 YAML 配置来驱动整个流程,从而大幅降低使用门槛。
这种设计模式值得关注,特别是对于需要频繁迭代 RAG 系统的团队。
项目概览
核心设计理念
UltraRAG 的关键创新在于架构层面的标准化设计:
- 组件模块化:将检索、生成、评估等 RAG 核心模块封装为独立的 MCP Server,提供函数级 Tool 接口
- 配置驱动:通过 YAML 配置文件声明数据流和处理逻辑,无需编写程序代码
- 链路简化:借助 MCP 客户端建立组件间的连接,简化了系统集成的复杂度

这种设计特别适合需要快速原型验证和频繁调整 RAG 管道的场景。
版本迭代——2.1 版本的三大方向
最新的 2.1 版本围绕以下方向进行了完整升级:

1. 原生多模态统一框架
- 同时支持文本和图像的检索与生成能力
- 新增 VisRAG Pipeline,实现从 PDF 到多模态问答的完整闭环
- 内置多模态 Benchmark 覆盖视觉问答等任务类型,提供统一的评估体系
- 特别之处在于集成了 MinerU 工具,可高保真还原 PDF 中的复杂版面与多栏结构,同时支持将 PDF 按页转换为图像,保留视觉布局信息
2. 知识接入与语料构建的自动化
- 支持多格式文档自动解析(Word、电子书、网页存档等)
- 内置分块策略,无需编写脚本即可构建统一格式的知识库
- 对比传统方案,这可以显著减少数据预处理的工作量
3. 统一工作流与可视化分析
- YAML 配置驱动检索、生成、评估的全流程
- 内置 Case Study Viewer,支持交互式浏览与结果分析
- 提升实验复现和对比的效率
应用场景与效果示例
通过两个实际案例来说明 UltraRAG 的应用能力:
场景一:学术文献解析
基于《Attention is All You Need》论文提问:"论文中的表 4 具体说了什么?"系统可以直接解析表格内容,提取关键信息并给出结构化答案。这得益于 2.1 版本的多模态能力——PDF 中的文本和图表都能被准确识别和理解。
场景二:商业报告分析
基于麦肯锡《生成式人工智能的经济潜力》报告,提问生成式 AI 最有潜力的企业职能及其影响。系统能够结合正文内容和图表数据给出综合回答,这对于需要从复杂文档中快速提取洞察的场景特别有价值。
部署与使用
安装部署
UltraRAG 支持两种部署方式:
方式一:Conda 虚拟环境
conda create -n ultrarag python=3.10
conda activate ultrarag
pip install ultrarag
方式二:Docker 容器
提供完整的 Docker 镜像,避免环境配置问题。
使用流程
典型的使用步骤分为三个阶段:
- 编写 Pipeline 配置文件:用 YAML 格式声明数据源、处理模块和输出方式
- 编译 Pipeline 并调整参数:验证配置的正确性,微调各模块的超参数
- 运行 Pipeline:执行完整的 RAG 流程,通过 Case Study Viewer 查看和分析结果
整个过程不需要编写代码,配置一个 YAML 文件即可驱动整个系统运行。这对于快速原型开发和模型研究人员特别友好。
配置管理
UltraRAG 提供了详细的文档和快速开始指南,可直接参考官方文档了解完整的配置选项和最佳实践。
与其他 RAG 框架的对比维度
| 维度 | UltraRAG | 传统 RAG 框架(如 LangChain) |
|---|---|---|
| 配置方式 | YAML 声明式配置,无代码 | 需要编写 Python 代码 |
| 多模态支持 | 原生多模态(文本+图像),PDF 高保真解析 | 通常需要二次开发或插件 |
| 学习曲线 | 低,适合非编程背景的使用者 | 中等,需要掌握编程基础 |
| 实验复现 | 配置文件版本管理,高度可复现 | 代码维护,版本管理相对复杂 |
| 可视化分析 | 内置 Case Study Viewer | 需要自行开发或集成 |
相关资源
代码仓库:https://github.com/OpenBMB/UltraRAG
官方文档:https://ultrarag.openbmb.cn/
Benchmark 数据集:https://modelscope.cn/datasets/UltraRAG/UltraRAG_Benchmark
快速开始指南:https://ultrarag.openbmb.cn/pages/cn/getting_started/quick_start
总结
UltraRAG 的价值在于它重新审视了 RAG 系统的构建方式。相比传统框架需要编写大量胶水代码,这个项目通过 MCP 协议的标准化和 YAML 驱动的配置方式,显著降低了使用门槛。特别是在多模态能力和 PDF 解析质量方面的投入,使其能够处理现实中更复杂的文档场景。
对于想要快速搭建 RAG 系统、进行实验对比,或是团队中缺乏编程背景的场景,这个项目值得优先考虑。如果你的团队更关注深度定制和扩展能力,可能还需要结合传统框架的灵活性。但作为一个开源项目,UltraRAG 提供的这套思路和工具集,确实代表了 RAG 系统开发的一个有益的方向。