你可能对 Coding Plan 耳熟能详了,但是字节火山引擎又卷出了新高度,搞了个Agent Plan:

怎么理解 Agent Plan?
Coding Plan 只能用来覆盖 coding 过程消耗的 token,而 Agent Plan 除了 coding token 之外,还可以调用绘图工具(Seedream 5.0)、视频生成工具(Seedance 2.0)、联网搜索、embedding 等 Harness 工具。
简单说:
Agent Plan = Coding Plan + Image 生成 + Video 生成 + 其他工具链
这样你就不用为每个 AIGC 服务单独接一套 API 了。
Agent Plan 包含什么
Agent Plan 引入了 AFP(Agent Fuel Points,Agent 燃料值)作为统一的资源计量单位,本质上就是一种 Credits。

以 Medium 套餐为例:
- 10000 AFP / 5 小时
- 35000 AFP / 周
- 100000 AFP / 月
路由大模型支持以下这些(国内各家一线模型基本都支持了):

最低档用不了 Seedance,不能生视频的 Agent 不是好牛马。Medium 及以上档位还会送个 ArkClaw 轻量版实例。
苏米注:AFP 的消耗量因任务而异。根据实测,一张图片大概消耗几十个 AFP 值,生成视频会消耗几百个 AFP 值,具体数值和图片/视频的分辨率、时长等相关。10 万点/月的额度对于日常使用基本够用。
配置方法(两种方式)
方式一:使用 Ark Helper(推荐)
在 Agent 所在机器的终端中输入:
curl -fsSL https://lf3-static.bytednsdoc.com/obj/eden-cn/ylwslo-yrh/ljhwZthlaukjlkulzlp/install.sh | sh
安装完成后输入 ark-helper,会弹出 TUI 界面:

选择 Agent Plan → SSO 登录自动获取 API Key → 选择模型(推荐 ark-code-latest,对应火山引擎后台的 Auto 模型,会智能判断哪个模型最适合承接工作):

配置完成后,在 Agent 对话中 /reset 一下,就能看到更新后的模型了。
方式二:手动配置
如果不打算使用 ark-helper,可以采用手动配置 custom endpoint 的方式:
hermes model
然后输入:
- API Base URL:
https://ark.cn-beijing.volces.com/api/plan/v3 - API Key:从 火山引擎控制台 复制
- Model Name:从 模型列表页面 复制,如
deepseek-v4-pro-beta
获取 API Key 的页面:

配置完成后同样 /reset 即可生效。
实战案例
案例 1:自媒体工作流 Skills 的安装和适配
先让 Agent 将 draco-skills-collection 仓库中的 skills 安装好:

然后让 Agent 在 GitHub 仓库里创建一个 Agent Plan 专用 Skills 集合并完成所有 Skills 的改造以适配,比如用 seedream 替换 nano banana,以及用 Agent Plan 自带的 seedream/seedance代替需要通过API KEY打通的版本。
目前已支持的 Skills 涵盖了基于飞书体系的信源抓取、日报撰写推送归档、飞书文档推送公众号、公众号封面生成、AI 短剧管线、播客生成、Hyperframes/Manim/Remotion、英文单词教学视频生成等一系列 skills:

以上任务一共消耗 AFP 点数 1400 左右。速度非常快,20 个左右 skills,大概两三分钟就搞定了。
案例 2:多模态网站构建
Agent Plan 中最重要的就是多模态能力——字节家的 Seedream 5.0(生图)和 Seedance 2.0(生视频)。
小试牛刀先来画个折纸女孩:

然后用这张图生成视频,Seedream 和 Seedance 能力都通了。
接下来完成一个多模态网站任务——"动漫风格馆",让 Agent 利用 Seedream 5.0 和 Seedance 2.0 的生图和生视频能力制作一个集萃全世界著名动漫风格的网站。
案例 1 和案例 2 合在一起,基本意味着你可以把飞书 + Agent Plan 当成你的"数字座舱"——写文章、推送到公众号、生成播客、生成图片、生成视频、创建多模态网站,几乎不需要触碰若干个不同工具的 GUI,只需要和 Agent 交互就能得到想要的一切。
案例 3:专业数据查询
打开 ArkClaw 的"专业数据库"功能后,可以查询金融数据。比如:
帮我从中国金融数据集中查询和分析招商银行过去 5 年的盈利能力是否承压
ArkClaw 输出的分析报告包含:
- ROE 持续下行:从 2021 年的 16.96% 下降至 2025 年的 13.44%,核心盈利能力面临较大压力
- 净利润增长陷入停滞:2023 年净利润同比增速降至 0%
- 净利率逆势提升:从 2021 年的 36.18% 提升至 2025 年的 44.77%,通过成本管控对冲营收增长乏力
专业数据库支持的数据类型包括:
- A 股股票数据(公司基本信息、估值指标、盈利能力等,支持 881+ 个指标)
- 历史市场数据(A 股/港股/美股的历史行情)
- 企业信息查询(工商注册信息和企业风险信息)
- 宏观经济数据(GDP、人口、失业率等)

写在最后
每天跟 Agent 打交道超过 6 小时之后,有一个强烈的感受:Agent 这场战争,全模态者为王。
在全模态都拥有 SOTA 模型的厂商将获得最终的胜利。海外的话,OpenAI 有这个优势——GPT-5.5 的 coding 能力强是一方面,另一方面就是在 coding 过程中 GPT-Image-2 能直接帮你把视觉物料都准备好,真的可以实现一站式 coding。
再看国内,目前字节领先——编程、绘图、视频、音频等模型在各细分领域都基本处在第一梯队,阿里紧随其后,然后是逐渐发力的腾讯和拥有全模态能力的 MiniMax 并列第三。
各家编程能力不相伯仲那天,图片、视频、音频等内容的生成能力才是胜负手。毕竟,人本来就是多模态生物,能看到能听到才是王道。
苏米注:
Agent Plan 的定价页面:volcengine.com/activity/agentplan
如果你需要同时使用 coding、绘图、视频生成等多种 AI 能力,Agent Plan 比单独订阅各项服务要划算得多
配置文档:volcengine.com/docs/82379/2373743