这周我把 OpenClaw 部署到本地,顺手接入了阶跃星辰的 Step 3.5 Flash。

直观感受是:框架能让 Agent 跑起来,但能不能稳定、能不能深度定制,还是要看“基座模型”。
OpenClaw 的 Star 数在前几天突破 25w+,成为 GitHub Star 历史第一,同时阶跃把 Step 3.5 Flash 做到“全链路开源”(预训练权重、中训练权重、训练框架一并开放),这两个信号叠加,对开发者和产品团队很关键
我们终于有机会把 Agent 能力从可用推进到可控、可定制。
三个关键信号
Agent 框架进入全民实验期:OpenClaw 用不到四个月冲到 GitHub 历史 Star 第一,说明开发者在密集验证 Agent 工作流。
好模型不只要“开源”,还要“可复现”:阶跃公布 Base 权重、Midtrain 权重和 Steptron 训练框架,这是从“用成品”到“可再训练”的门槛变化。
工程落地在收敛:Step 3.5 Flash 的活跃参数规模(约 11B)与本地部署门槛匹配,消费级硬件即可运行,且推理速度标称可达 ~350 token/s。
全链路开源到底开放了什么
常见的开源模型只给最终微调后的权重,二次开发空间有限。Step 3.5 Flash 这次开放了三块核心:
- Base 权重:预训练阶段产物,适合从头微调(全参数或 LoRA),做深度定制。
- Midtrain 权重:在 Base 基础上加入中间训练后,推理更强,适合 Agent/工具调用的二次开发。
- Steptron 训练框架:包含持续预训练和有监督微调(SFT),后续计划补充强化学习(RL)与评估模块。

换句话说,开发者不仅能用成品,还能对齐训练过程、复现并迭代自己的版本。
数据点与部署门槛
社区采用:Step 3.5 Flash 在 Hugging Face 下载量累计 300k+;近期在 OpenClaw 用户调用日榜 Top1,月榜 Top4(随时间会变化)。

能力维度:在公开基准上,推理和代码指标优于同级别开源模型,部分场景接近部分闭源模型;多步骤任务执行稳定性表现突出。

硬件与速度:约 11B 激活参数,Mac Studio M4 Max 可流畅运行;标称推理速度最高可达 ~350 token/s(代码任务下更快)。
隐私与成本:本地部署时数据不出内网;通过 OpenRouter 远程调用时具备限时免费档,需关注配额、速率与数据合规。
如何选 Base / Midtrain / 仅终版权重
| 维度 | Base 权重 | Midtrain 权重 | 常见仅终版权重 |
|---|---|---|---|
| 功能范围 | 预训练底座,需补全指令/对齐 | 具备更强推理与工具调用基础 | 开箱可用,但可控性有限 |
| 技术特征 | 全参数可调,训练自由度高 | 更接近 Agent 场景,可少量数据快速适配 | 训练细节不透明,难以复现 |
| 使用门槛 | 需要数据、算力和训练经验 | 中等门槛,适合二次开发 | 门槛低,直接部署/推理 |
| 适合人群 | 研究团队、需深度定制的企业 | 创业团队、需要快速上线的产品组 | 个人开发者、概念验证 |
在 OpenClaw 接入 Step 3.5 Flash
如果只做功能验证,不想本地部署模型,可以走 OpenRouter/StepFun 的在线调用。

我的流程如下:
安装 OpenClawcurl -fsSL https://openclaw.ai/install.sh | bash
运行初始化向导openclaw onboard
按提示完成初始化,打开 WebUI 进入控制台。
配置模型 Provider
WebUI 路径:Config → Models → Providers → Add Entry
- API Type:openai-completions
- Base URL:https://api.stepfun.ai/v1(国内可用 https://api.stepfun.com/v1,或 OpenRouter 地址)
- API Key:填 StepFun 或 OpenRouter 申请的 Key
- Model ID:step-3.5-flash
保存并刷新,将 Primary Model 设为 step-3.5-flash 即可使用。
小结:OpenClaw 的 Provider 配置采用“OpenAI 兼容”方式,命名和字段与常见 SDK 对齐,整体上手成本不高。
使用体验与观察
- 交互稳定:多步骤工具调用流程下,失败重试和上下文保持表现稳定。
- 响应速度:代码生成类任务的首 token 延迟较低,流式响应顺畅。
- 本地 vs 在线:本地推理更利于隐私与低延迟;在线调用适合快速 PoC 和无需维护算力的团队。
- 可定制潜力:有了 Base/Midtrain + Steptron,可以按业务场景构建自有训练链路,而不是只能做微调“贴皮”。
落地建议:两种常见路径
- 快速验证(1–3 天):OpenClaw + Step 3.5 Flash(OpenRouter/StepFun),完成 Agent 工作流原型验证。
- 深度定制(2–6 周):基于 Midtrain 或 Base + Steptron,补齐 SFT/RL/评估,构建域内能力与工具调用策略。
注意事项
- 合规与隐私:在线调用涉及第三方服务,注意数据脱敏与权限控制;本地部署关注模型权重与数据集许可。
- 成本与配额:限时免费政策会变化,建议为生产环境准备降级与配额告警机制。
- 评测与回归:引入自定义数据后,建立任务级评测与回归集,关注多步推理一致性与工具调用失败率。
- 路线规划:阶跃后续计划开放 RL 和评估模块,SFT 数据将陆续公开,可与团队版本规划同步。
资源链接
- GitHub(Step 3.5 Flash):https://github.com/stepfun-ai/Step-3.5-Flash
- Hugging Face(Step 3.5 Flash):https://huggingface.co/stepfun-ai/Step-3.5-Flash
结尾
从产品视角看,OpenClaw 的爆火让 Agent 研发更易起步,而 Step 3.5 Flash 的“全链路开源”把可控性带给了更多团队:能用、能复现、能迭代。
我的建议是先用在线调用完成流程验证,再根据业务目标选择 Midtrain 或 Base,通过 Steptron 补齐训练与评估。
相较以往只能围着闭源 API 打转,现在我们可以真正把 Agent 能力内化为可持续演进的资产。
以上是这次实践的记录与思考,供你在团队落地时参考。