10+年产品经理聊聊产品、测测产品,产品人交流学习成长平台,按 Ctrl+D 收藏我们
关于我 留言板 小程序 标签云

苏米客

  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
  • 登录
  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
当前位置: 首页 » AI最新动态

Claude 军师模式:Opus 幕后指导,成本降 11.9%

4小时前 AI最新动态 25 0

Anthropic 最近在 Claude 平台上实装了一套"军师策略"(Advisor Strategy),主要目标是降低成本的同时提高次级模型的智商。

苏米注:最近很多网友反馈 Claude 降智了,其实 A 厂的顶尖模型 token 使用明显偏向 to B 和内部迭代。这个军师策略,说不定内部早就在用了。

简单来说,就是让最强大的 Opus 模型在后台当军师,让轻量级的 Sonnet 或 Haiku 模型当执行者。通过这种搭配,开发者可以用极低的成本,让智能体获得接近 Opus 级别的智商。

运作机制

军师策略的运作非常巧妙:

  1. 执行者主导:Sonnet 或 Haiku 从头到尾运行任务,调用工具,读取结果,不断尝试解决问题
  2. 关键时刻呼叫:当执行者遇到高难度决策、觉得自己搞不定时,呼叫 Opus 军师寻求指导
  3. 军师出招:Opus 读取共享上下文,给出明确计划、纠错建议或停止信号
  4. 继续执行:执行者拿到建议后继续干活

军师策略架构图

苏米注:这个设计很聪明。军师绝对不会亲自调用工具,也不会直接生成最终内容,它的职责仅仅是给执行者提供高层指导。

与传统模式的对比

这种玩法直接反转了业界常用的子智能体模式:

模式 统筹节点 执行者 特点
传统子智能体 超大模型 小模型工人池 需要复杂任务拆解
军师策略 小模型(Sonnet/Haiku) 小模型主导 军师只在卡壳时介入

在军师策略里,小巧且省钱的模型承担主导和汇报工作,最顶尖的推理算力全用在刀刃上。

模式对比图

实测数据

SWE-benchmark Multilingual 测试

带上 Opus 军师的 Sonnet 执行者:

  • 得分提升:+2.7 个百分点
  • 成本降低:-11.9%

SWE-benchmark 测试结果

BrowseComp 和 Terminal Benchmark 2.0

有 Opus 当军师的 Sonnet 不仅得分全面提升,花费也比单独使用 Sonnet 时更少。

基准测试对比

Haiku + Opus 组合

如果把执行者换成最小的 Haiku 模型,效果更加立竿见影:

  • BrowseComp 得分:19.7% → 41.2%(翻倍)
  • 成本下降:85%
  • 对比 Sonnet:得分落后 29%,但成本只有零头

Haiku 性能提升

苏米注:对于既需要一定智商又面临海量高并发需求的场景,Haiku+ 军师是极具杀伤力的性价比选项。

如何使用

军师工具已在 Claude 平台开启 Beta 测试。开发者只需在 Messages API 请求中声明 advisor_20260301,模型的交接工作就会在同一个 API 请求内自动完成。

核心代码配置

response = client.messages.create(
    model="claude-sonnet-4-6",  
    tools=[
        {
            "type": "advisor_20260301",
            "name": "advisor",
            "model": "claude-opus-4-6",
            "max_uses": 3,
        },
    ],
    messages=[...]
)

三个步骤上手

  1. 在请求头中加上 Beta 版特性声明:anthropic-beta: advisor-tool-2026-03-01
  2. 在 Messages API 请求里添加 advisor_20260301
  3. 根据具体业务场景调整系统提示词

计费方式

计费逻辑非常清晰:

  • 军师消耗的 Token:按 Opus 费率计算
  • 执行者消耗的 Token:按轻量级费率计算

因为军师通常只吐出 400-700 个 Token 的简短指导计划,而耗费大量 Token 的最终长文本全交给价格低廉的执行者,所以总体成本被压在全量跑大模型之下。

成本控制功能

官方内置了成本控制:

  • max_uses 参数:限制每次请求中呼叫军师的次数上限
  • 使用情况明细:军师消耗的 Token 单独列出,方便追踪

技术栈兼容

军师工具本质上只是 API 请求列表里的一个新增条目。你的智能体可以一边搜索资料、一边敲代码测试,遇到死胡同时顺手向 Opus 请教,所有动作在同一个循环里完美闭环。

苏米注:Anthropic 官方建议开发者用自己的评估数据集跑对比测试,分别看看单跑 Sonnet、军师策略组合、单跑 Opus 的效果差异。这种实测数据最有说服力。

总结

Claude 的军师策略提供了一个巧妙的解决方案:用小模型主导,大模型只在关键时刻介入。既保证了智商,又控制了成本。

对于需要平衡性能和成本的开发者来说,这是一个值得尝试的新方案。

来源:claude.com/blog/the-advisor-strategy

声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
未经允许不得转载:Claude 军师模式:Opus 幕后指导,成本降 11.9%
#Claude #军师模式 #Anthropic #Opus #Sonnet #AI 成本优化 
收藏 1
MateClaw:基于 Spring AI Alibaba 的个人 AI 操作系统开源
Anthropic 疯狂一周:四天四连发,从封杀到自建生态
推荐阅读
  • 刚刚!Cursor风控又加强了,可能是因为这个原因!
  • Google 重磅发布 Gemini Enterprise:智能体2.0时代正式开启,重新定义企业级AI Agent
  • Claude Code的Harness Engineering公开后,全世界的 Agent 能力提高了一个档次
  • GLM-4.7-flash 限时免费开放,GLM Coding Plan 即将限售,老用户抓紧了~
  • n8n 2.x 重大更新,让工作流走向对话式:Chat Hub、Agent、工作流对话
评论 (0)
请登录后发表评论
分类精选
Cursor 限制国内使用 Claude 等模型解决方案!
27551 8月前
学生/非学生:如何申请Cursor Pro免费会员,如何通过SheerID验证快速激活全攻略
25532 11月前
即梦AI图片2.1:一句话快速生成带中文的海报图,免费AI文生图、视频工具、AIGC创作工具
17264 1年前
注意!Cursor单设备登录新规:一个账户最多可以3台设备登录,且限制单点登录
16995 11月前
DeepSeek宣布:降价,最高降价75%!别错过这个优惠时段,赶紧充值
15182 1年前
刚刚!Cursor风控又加强了,可能是因为这个原因!
13710 12月前
字节跳动发布"扣子空间":AI协同办公的通用Agent平台开启效率革命
13644 11月前
Trae国内版,搭载 doubao-1.5-pro、DeepSeek R1/V3模型,对比 Trae 国际版有什么不同
13456 1年前
字节推出Trae CLI :Claude Code 和 Gemini CLI的国产平替 ?手把手教你如何安装Trae Agent
12112 9月前
Cline:自动化编程的VSCode插件Claude Dev + Gemini 2.0,快速构建智能应用
11426 1年前

文章目录

关注「苏米客」公众号

订阅推送更及时,手机查看更方便
分类排行
1 Anthropic 疯狂一周:四天四连发,从封杀到自建生态
2 Claude 军师模式:Opus 幕后指导,成本降 11.9%
3 28 个 OpenRouter 免费 AI 模型 API 汇总:无需信用卡即可使用
4 Codex 插件系统详解:将 Skills、应用集成与 MCP 打包成可复用工作流
5 Gemma 4 开源实测:31B 参数跻身全球前三,oMLX + Mac Mini 打造高性价比 AI 底座
6 GLM-5.1 代码能力实测:SWE-Bench Pro 全球第一,长程任务可连续工作 8 小时
7 DeepSeek 网页版灰度测试双模式:快速模式基于 3.2,专家模式或为 V4 早期版本
8 GLM-5.1 技术报告:744B 参数开源模型,SWE-Bench Pro 58.4 分全球第一
9 Coze 2.5 发布:Agent 独立身份与网络架构详解
10 谷歌发布 Gemma 4 全能模型,2 步教你在手机完美运行,离线且免费!
©2015-2024 苏米客XMSUMI 版权所有 · WWW.XMSUMI.COM 闽ICP备14005900号-6
微信文章助手 程序库 免费影视APP 免费字体下载 Axure RP 10 免费Axure模板 Axure元件库下载 申请友联