10+年产品经理聊聊产品、测测产品,产品人交流学习成长平台,按 Ctrl+D 收藏我们
关于我 留言板 小程序 标签云

苏米客

  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
  • 登录
  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
当前位置: 首页 » AI最新动态

Anthropic Advisor Tool 详解:Sonnet 智能接近 Opus,成本降低 11.9%

1月前 AI最新动态 344 0

Anthropic 最近发布了一个新的 API 工具,让 Sonnet 或 Haiku 在跑任务的过程中,遇到搞不定的决策时自动请教 Opus,拿到指导后继续干活。这个策略叫 Advisor Strategy,工具叫 Advisor Tool。

苏米注:这个设计思路很有意思——不是让大模型指挥小模型干活,而是让小模型在遇到难题时主动请教大模型。有点像公司里的"导师制",初级工程师干活,遇到卡点时找资深工程师请教。

工作原理:反过来的 Sub-Agent 模式

行业里常见的多 Agent 模式是:大模型当指挥官,拆解任务分给小模型去执行。Advisor 策略把这个方向反过来了。

Sonnet(或 Haiku)作为 Executor 全程执行任务,调用工具、读取结果、迭代推进。当它遇到一个自己判断力不够的决策点时,它会调用 Opus 作为 Advisor。Opus 拿到共享的上下文,返回一个计划、一个纠正、或者一个停止信号。然后 Sonnet 继续执行。

关键点:Advisor 不调用工具,不产出面向用户的输出,只提供指导。前沿级推理只在 Executor 需要的时候介入,其余时间全部按 Executor 的价格计费。

Advisor 工作流程图

这个设计的好处是:不需要任务拆解逻辑,不需要 worker pool,不需要编排框架。Executor 自己判断什么时候需要升级,整个过程在一次 API 调用里完成。

评测数据

Sonnet + Opus Advisor 组合

SWE-bench Multilingual

Sonnet + Advisor 比 Sonnet 单独跑提升了 2.7 个百分点,同时每个任务的成本降低了 11.9%。成本降低的原因是 Advisor 的介入让 Executor 少走弯路,减少了总 token 消耗。

SWE-bench Multilingual 评测对比图

BrowseComp 和 Terminal-Bench 2.0

在 BrowseComp 和 Terminal-Bench 2.0 上,Sonnet + Advisor 同样超过了 Sonnet 单独跑,而且每个任务的成本更低。

BrowseComp + Terminal-Bench 评测图

Haiku + Opus Advisor 组合

这个组合更有趣。在 BrowseComp 上,Haiku + Advisor 得分 41.2%,是 Haiku 单独跑(19.7%)的两倍多。跟 Sonnet 单独跑比,分数低了 29%,但成本低了 85%。

Haiku + Advisor 评测对比图

对于高吞吐、需要平衡智能和成本的场景,这个组合很有吸引力。用 Haiku 的价格拿到接近 Sonnet 水平的结果。

如何使用

API 层面非常简单。在 Messages API 请求的 tools 数组里加一个 advisor_20260301 类型的工具,指定 Advisor 模型是 Opus,设一个 max_uses 限制每次请求最多请教几次。

整个模型交接在一次 /v1/messages 请求里完成,不需要额外的网络来回,不需要自己管理上下文传递。Executor 决定什么时候调用 Advisor,Anthropic 负责把精选的上下文路由给 Advisor 模型,拿到计划后 Executor 继续执行。

计费方式

  • Advisor 的 token:按 Advisor 模型的价格算(Opus 的 $5/$25)
  • Executor 的 token:按 Executor 模型的价格算(Sonnet 的 $3/$15 或 Haiku 的 $1/$5)

因为 Advisor 每次只生成一个短计划(通常 400-700 个 token),整体成本远低于全程跑 Opus。可以通过 max_uses 限制 Advisor 调用次数来控制成本。Advisor 的 token 消耗在 usage 中单独报告。

早期用户反馈

"在复杂任务上做出了更好的架构决策,在简单任务上没有任何额外开销。计划和执行轨迹完全是两个级别。"
—— Eric Simmons,Bolt CEO

"我们看到了 Agent 轮次、工具调用次数和整体分数的明确改善,比我们自己构建的 planning 工具效果更好。"
—— Kay Zhu,Genspark 联合创始人兼 CTO

"在结构化文档提取任务上,Advisor 让 Haiku 4.5 按需请教 Opus 4.6,达到了前沿模型的质量,成本低 5 倍。"
—— Anuraj Pandey,Eve Legal 机器学习工程师

四个关键信号

  1. 原生支持模型协作:这是 Anthropic 第一次在 API 层面提供模型间协作的原生支持。之前想让 Sonnet 和 Opus 配合,你得自己写编排逻辑、管理上下文传递、处理两次 API 调用的状态。现在一个 tool 声明就搞定。
  2. 巧妙的定价逻辑:Advisor 每次只输出 400-700 个 token 的短计划,按 Opus 价格算也就几分钱。但这几分钱的指导可以让 Executor 少走弯路,减少总 token 消耗。所以出现了"加了 Advisor 反而总成本更低"的现象。
  3. Haiku + Advisor 值得关注:BrowseComp 41.2% 的成绩用 Haiku 的价格拿到,比 Sonnet 单独跑便宜 85%。对于大规模、成本敏感的 Agent 部署场景,这个组合可能比 Sonnet 更合适。
  4. 产品线密度增加:Mythos、Managed Agents、Advisor Tool,Anthropic 在一周内连续发布了最强模型、Agent 基础设施平台、模型间协作工具,产品线的密度在快速增加。

总结

苏米注:Advisor Strategy 的核心价值在于它重新思考了多模型协作的模式。传统的"大模型指挥小模型"需要复杂的编排逻辑,而"小模型请教大模型"则更加自然和高效。这种设计思路值得在其他 AI 系统架构中借鉴。

对于开发者来说,这意味着:

  • 更简单的 API 使用方式
  • 更低的总体成本
  • 更好的任务执行效果

参考材料:

  • The Advisor Strategy 官方博客
  • Advisor Tool API 文档
声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
未经允许不得转载:Anthropic Advisor Tool 详解:Sonnet 智能接近 Opus,成本降低 11.9%
#Anthropic #Claude #Advisor Tool #AI 模型 #API 
收藏 1
Claude Code 集成 Codex CLI 实战:通过 MCP 实现双 AI 助手协同编程
Hermes Agent vs OpenClaw 深度对比:47k Star 新贵与 349k 老牌谁更强?
推荐阅读
  • OpenAI联手谷歌,开源 agents.md,Agent文档编写有了统一标准!
  • n8n 2.0 来了,到底改了什么?升级迁移项目该怎么做?
  • Claude 身份验证政策详解:Anthropic 新规对中国用户的影响与应对
  • AutoClaw Hermes 自进化能力上线:可控可视的 AI 记忆系统,内置 Skills 商店
  • TRAE SOLO 中国版,正式发布!完全免费!
评论 (0)
请登录后发表评论
分类精选
Cursor 限制国内使用 Claude 等模型解决方案!
30256 10月前
学生/非学生:如何申请Cursor Pro免费会员,如何通过SheerID验证快速激活全攻略
27277 1年前
注意!Cursor单设备登录新规:一个账户最多可以3台设备登录,且限制单点登录
18825 1年前
即梦AI图片2.1:一句话快速生成带中文的海报图,免费AI文生图、视频工具、AIGC创作工具
18789 1年前
DeepSeek宣布:降价,最高降价75%!别错过这个优惠时段,赶紧充值
15812 1年前
Trae国内版,搭载 doubao-1.5-pro、DeepSeek R1/V3模型,对比 Trae 国际版有什么不同
15364 1年前
字节推出Trae CLI :Claude Code 和 Gemini CLI的国产平替 ?手把手教你如何安装Trae Agent
14913 10月前
刚刚!Cursor风控又加强了,可能是因为这个原因!
14503 1年前
字节跳动发布"扣子空间":AI协同办公的通用Agent平台开启效率革命
14045 1年前
Cline:自动化编程的VSCode插件Claude Dev + Gemini 2.0,快速构建智能应用
12247 1年前

文章目录

关注「苏米客」公众号

订阅推送更及时,手机查看更方便
分类排行
1 SkyClaw 免费 Agent 模型:无限 Token,适配 OpenClaw、Hermes、Nanobot
2 MiniCPM5-1B 开源:1B 参数的端侧 AI 桌宠
3 DeepSeek API 永久降价:从 78 元到 9 元,大模型价格战进入新阶段
4 Anthropic 联合创始人 Chris Olah 在梵蒂冈 AI 通谕发布会上的发言要点
5 Qwen 3.7-Max上线百炼平台:性能超越GLM-5.1,Qwen市场关注度待观察
6 千问云正式上线:一个 API Key 打通 150+ AI 模型,阿里 MaaS 平台全面开放
7 Anthropic 3 亿美元收购 Stainless:MCP 生态的接口革命
8 OpenCode Go:10 美元/月的统一模型订阅,值得重度开发者入手吗?
9 Codex 6连更:AI 看屏、锁屏控制、自主干一整天
10 Gemini 3.5 Flash发布:速度碾压GPT但价格翻3倍开发者炸锅
©2015-2024 苏米客XMSUMI 版权所有 · WWW.XMSUMI.COM 闽ICP备14005900号-6
微信文章助手 程序库 免费影视APP 免费字体下载 Axure RP 10 免费Axure模板 Axure元件库下载 申请友联