10+年产品经理聊聊产品、测测产品,产品人交流学习成长平台,按 Ctrl+D 收藏我们
关于我 留言板 小程序 标签云

苏米客

  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
  • 登录
  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
当前位置: 首页 » AI学习教程

多 Agent 协调的五种模式详解:从生成 - 验证到共享状态,按需演进

1月前 AI学习教程 345 0

摘要:Anthropic 最新博客将多 Agent 协调归纳为五种模式,从最简单到最复杂,给出了何时演进到下一级的判断标准。大部分团队的问题不是不知道多 Agent 的好处,而是上来就挑最酷的模式,结果被协调开销拖死了。


用一个 Agent 搞不定复杂任务?上多 Agent 吧。这个判断现在大家基本都认了。但上多 Agent 之后紧跟着一个更具体的问题:这些 Agent 之间怎么配合?

Anthropic 刚发的这篇博客正好补了这个缺口,把多 Agent 协调归纳成五种模式,从最简单到最复杂,还给出了什么时候该从一种演进到另一种的判断标准。

苏米注:读完最大的感受是:大部分团队的问题不是不知道多 Agent 的好处,而是上来就挑了一个听起来最酷的模式,结果被协调开销拖死了。Anthropic 的建议是,从最简单的能跑通的模式开始,看它哪里撑不住了,再往上演进。

模式一:生成 - 验证(Generator-Verifier)

这是最简单的多 Agent 模式,也是部署最广的。

Generator-Verifier 模式架构图

逻辑很简单。一个 Agent 负责生成输出,另一个负责评估。评估通过就结束,不通过就把反馈打回给生成方,重新来一轮。循环下去直到通过或者达到最大迭代次数。

最典型的应用是代码生成:一个 Agent 写代码,另一个写测试、跑测试。客服场景也适用,生成方起草邮件回复,验证方检查是否准确引用了产品文档、是否回应了用户提到的每个问题。

常见踩坑点

踩坑 1:验证标准太模糊

如果你只告诉验证方检查输出是否足够好,它大概率会糊弄人,放行所有东西。验证方的价值完全取决于你能不能把"好"拆成具体的、可检查的标准。

踩坑 2:迭代循环卡死

生成方解决不了验证方提的问题,两边来回震荡不收敛。所以必须设最大迭代次数,加一个兜底策略,比如升级给人处理,或者返回当前最好的版本并标注问题。

模式二:编排 - 子 Agent(Orchestrator-Subagent)

这是层级式的分工。一个 Agent 当 Team Lead,负责规划任务、分配工作、汇总结果。子 Agent 接到具体任务后执行完就汇报。

Orchestrator-Subagent 模式架构图

Claude Code 用的就是这个模式。主 Agent 自己写代码、编辑文件、跑命令,需要搜索大型代码库或者调查独立问题时,就在后台派 subagent 去做,自己继续手头的活。

这个模式适合任务拆分清晰、子任务之间依赖少的场景。比如自动化代码审查:一个 PR 进来,需要查安全漏洞、检查测试覆盖率、评估代码风格、验证架构一致性。每个检查维度独立、上下文不同、输出格式明确。

核心问题:信息瓶颈

当子 Agent 发现了对其他子 Agent 有用的信息时,这条信息必须经过编排 Agent 中转。安全子 Agent 发现了一个认证漏洞,这个发现影响架构子 Agent 的分析。编排 Agent 需要识别这种依赖关系并正确路由信息。经过几轮中转之后,关键细节经常被丢失或者在摘要中被省略掉。

苏米注:我在用 Claude Code 的 subagent 时也有类似体感。subagent 搜完代码库回来的结果有时候会把关键上下文压缩掉,主 Agent 拿到的是一个干净但不够完整的摘要。

模式三:Agent 团队(Agent Teams)

编排模式里的子 Agent 是用完即弃的。接到任务,干完活,交结果,走人。但如果任务需要 worker 在多轮中积累经验呢?

Agent 团队模式的区别就在这里:worker 是持久的。

Agent Teams 模式架构图

一个协调者启动多个 worker Agent 作为独立进程。领任务,干活,交结果。不重置,不遗忘。每个 worker 在多轮迭代中积累对自己负责领域的熟悉度。

最直观的例子是大规模代码迁移。每个 worker 分管一个服务,在反复处理这个服务的依赖、测试、部署配置的过程中,逐渐摸清它的脾气。一次性 subagent 每次接手都要重新理解服务的配置约定和依赖关系,持久 worker 第一次弄明白之后后续迭代直接复用,省掉重复的上下文加载。

硬前提:独立性

团队模式里的 worker 没有中间人帮忙传话。一个 worker 的改动影响了另一个,谁都不知道,产出可能冲突。常见的应对方式是文件级别的分区或者合并前跑冲突检测,但这增加了协调者的复杂度。

模式四:消息总线(Message Bus)

前面三种模式都有明确的协调者在指挥交通。但如果 Agent 数量继续增加、交互模式变得不可预测呢?

Message Bus 模式架构图

消息总线引入了一个共享通信层。核心操作就两个:发布和订阅。Agent 订阅自己关心的 topic,路由器负责分发。新 Agent 上线不需要改已有的连接,订阅相关 topic 就能开始接收工作。

Anthropic 举的例子是安全运维自动化。告警从多个来源进来,分诊 Agent 分类后路由给对应的调查 Agent,调查结果再流向响应协调 Agent。事件一个阶段接一个阶段地流下去,新出了什么威胁类型就加个新 Agent,各个 Agent 还能独立开发部署。

代价:可追溯性变差

一个告警触发五个 Agent 之间的事件级联,要搞清楚到底发生了什么,调试难度比编排模式那种顺序决策链高了不少。路由器分错类或者丢了事件更麻烦,系统会静默失败,什么都不处理但也不崩溃。

模式五:共享状态(Shared State)

前四种模式里都有一个中心角色在管理信息流。共享状态模式把这个中间人去掉了。

Shared State 模式架构图

没有中央协调者。Agent 自主运行,读写一个共享的数据库、文件系统或文档。工作一般从往存储里丢一个问题或数据集开始。停下来的条件有几种:时间到了、结果收敛了,或者有个专门的 Agent 判断存储里的东西已经够用了。

研究综合场景是这个模式的主场。多个 Agent 分头调查一个复杂问题的不同方面,学术 Agent 发现了一个关键研究者,这条信息对行业 Agent 调查这个研究者的公司立刻就有用。不用等协调者来路由,发现直接写进存储,其他 Agent 马上就能看到。

代价与挑战

Agent 可能重复工作或者走互相矛盾的方向。更棘手的是反应式循环:Agent A 写了一个发现,Agent B 读到后写了跟进,Agent A 看到跟进后又回应。系统持续烧 token 但不收敛。

五种模式对比总结

模式 复杂度 适用场景 主要挑战
生成 - 验证 ⭐ 代码生成、客服回复 验证标准模糊、迭代卡死
编排 - 子 Agent ⭐⭐ 任务拆分清晰、子任务独立 信息瓶颈、上下文丢失
Agent 团队 ⭐⭐⭐ 需要积累经验的长期任务 worker 独立性、冲突检测
消息总线 ⭐⭐⭐⭐ 大规模 Agent 协作、事件驱动 可追溯性差、静默失败
共享状态 ⭐⭐⭐⭐⭐ 研究综合、复杂问题调查 重复工作、反应式循环

苏米的实践建议

演进原则:从最简单的能跑通的模式开始,看它哪里撑不住了,再往上演进。不要上来就选最复杂的模式。

对于大多数团队,我建议从生成 - 验证模式开始,这是最简单且部署最广的模式。当你的任务需要拆分成多个独立子任务时,再考虑演进到编排 - 子 Agent模式。

如果你的子 Agent 需要在多轮中积累经验,再考虑Agent 团队模式。只有当 Agent 数量继续增加、交互模式变得不可预测时,才需要考虑消息总线或共享状态模式。

模式演进路径图


文章来源:Feisky

原文编译自 Anthropic 博客《Multi-agent coordination patterns: Five approaches and when to use them》

声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
未经允许不得转载:多 Agent 协调的五种模式详解:从生成 - 验证到共享状态,按需演进
#Anthropic #多Agent 
收藏 1
蚂蚁集团开源 6 大可视化 Skill,Claude Code 画图能力大升级
Anthropic Agent 三件套全面解读:Claude Code、Cowork、Managed Agents 定位与使用场景详解
推荐阅读
  • 手把手教你用腾讯IMA搭建个人知识库,两个案例实战结构化个人知识库
  • 限时白嫖:每月5刀,手把手教你部署 Alist 网盘、搭建VPS、n8n云服务器,一键安装76款开源程序
  • 公众号排版太麻烦?两款极简美学微信 Markdown 编辑器推荐与搭建教程
  • DeepSeek-TUI:把 DeepSeek变成终端里的 Coding Agent,这才是DeepSeek V4的正确打开方式
  • 手把手教你部署有道龙虾 LobsterAI,无需命令行的 7×24 小时 AI 数字员工
评论 (0)
请登录后发表评论
分类精选
Cursor永久免费攻略:无限邮箱注册+重置机器码+Cursor试用期重置工具实现永久免费使用
47446 1年前
手把手教你如何使用扣子Coze搭建“文生图” AI Bot
19882 1年前
n8n新手入门指南:5 分钟本地部署 + 中文汉化 + 快速启动,玩转工作流(Docker版)
18656 11月前
安装字节Trae登录提示App Unavailable(应用程序不可用)解决办法,这份官方指南请收好!
17886 1年前
零基础上手 VSCode + Claude Code + GLM-4.6 保姆级安装配置教程
15974 7月前
Gemini CLI 装好了,登录异常怎么办?手把手教你解决 Gemini CLI 登录问题
15418 10月前
一文搞懂什么是 Vibe Coding?Vibe Coding工具推荐及Cursor编程开发实践
14484 1年前
AI 概念篇:Token是什么?一文讲清楚Token分词、窗口、计费与常用计算工具
13785 5月前
手把手教你使用 Gemini 2.5 Pro 免费 API搭建本地知识库,一键接入 Gemini!
13503 10月前
手把手教你快速入门OpenCode + GLM-4.7 + Oh-My-Opencode + Skills 安装配置与高效使用指南
12787 4月前

文章目录

关注「苏米客」公众号

订阅推送更及时,手机查看更方便
分类排行
1 Ollama与LM Studio本地运行AI大模型完全指南
2 WorkBuddy专家与专家团功能实测
3 手把手教你白嫖 Kiro Pro一个月,支持Claude Opus 4.7、GLM 5(国内信用卡亲测可用)
4 Codex 桌面宠物保姆级教程,从开启到自定义全攻略
5 Codex 宠物功能上手指南:让 AI 编程更有趣
6 火山引擎方舟 Agent Plan 上手指南:从开通到配置全流程
7 DeepSeek-TUI:把 DeepSeek变成终端里的 Coding Agent,这才是DeepSeek V4的正确打开方式
8 Codex App 保姆级教程:从零开始,60 秒做出你的第一个 AI 应用
9 Codex 全面指南:从安装到进阶,13 个核心功能详解
10 Obsidian 接入 AI 完整指南:三种方法实现 AI IDE、AI 插件、Terminal 插件集成
©2015-2024 苏米客XMSUMI 版权所有 · WWW.XMSUMI.COM 闽ICP备14005900号-6
微信文章助手 程序库 免费影视APP 免费字体下载 Axure RP 10 免费Axure模板 Axure元件库下载 申请友联