当前位置：首页 » AI最新动态

Step 3.5 Flash 全链路开源，冲上 OpenClaw 调用榜

4月前 AI最新动态 1854 0

这周我把 OpenClaw 部署到本地，顺手接入了阶跃星辰的 Step 3.5 Flash。

直观感受是：框架能让 Agent 跑起来，但能不能稳定、能不能深度定制，还是要看“基座模型”。

OpenClaw 的 Star 数在前几天突破 25w+，成为 GitHub Star 历史第一，同时阶跃把 Step 3.5 Flash 做到“全链路开源”（预训练权重、中训练权重、训练框架一并开放），这两个信号叠加，对开发者和产品团队很关键

我们终于有机会把 Agent 能力从可用推进到可控、可定制。

三个关键信号

Agent 框架进入全民实验期：OpenClaw 用不到四个月冲到 GitHub 历史 Star 第一，说明开发者在密集验证 Agent 工作流。

好模型不只要“开源”，还要“可复现”：阶跃公布 Base 权重、Midtrain 权重和 Steptron 训练框架，这是从“用成品”到“可再训练”的门槛变化。

工程落地在收敛：Step 3.5 Flash 的活跃参数规模（约 11B）与本地部署门槛匹配，消费级硬件即可运行，且推理速度标称可达 ~350 token/s。

全链路开源到底开放了什么

常见的开源模型只给最终微调后的权重，二次开发空间有限。Step 3.5 Flash 这次开放了三块核心：

Base 权重：预训练阶段产物，适合从头微调（全参数或 LoRA），做深度定制。
Midtrain 权重：在 Base 基础上加入中间训练后，推理更强，适合 Agent/工具调用的二次开发。
Steptron 训练框架：包含持续预训练和有监督微调（SFT），后续计划补充强化学习（RL）与评估模块。

换句话说，开发者不仅能用成品，还能对齐训练过程、复现并迭代自己的版本。

数据点与部署门槛

社区采用：Step 3.5 Flash 在 Hugging Face 下载量累计 300k+；近期在 OpenClaw 用户调用日榜 Top1，月榜 Top4（随时间会变化）。

能力维度：在公开基准上，推理和代码指标优于同级别开源模型，部分场景接近部分闭源模型；多步骤任务执行稳定性表现突出。

硬件与速度：约 11B 激活参数，Mac Studio M4 Max 可流畅运行；标称推理速度最高可达 ~350 token/s（代码任务下更快）。

隐私与成本：本地部署时数据不出内网；通过 OpenRouter 远程调用时具备限时免费档，需关注配额、速率与数据合规。

如何选 Base / Midtrain / 仅终版权重

维度	Base 权重	Midtrain 权重	常见仅终版权重
功能范围	预训练底座，需补全指令/对齐	具备更强推理与工具调用基础	开箱可用，但可控性有限
技术特征	全参数可调，训练自由度高	更接近 Agent 场景，可少量数据快速适配	训练细节不透明，难以复现
使用门槛	需要数据、算力和训练经验	中等门槛，适合二次开发	门槛低，直接部署/推理
适合人群	研究团队、需深度定制的企业	创业团队、需要快速上线的产品组	个人开发者、概念验证

在 OpenClaw 接入 Step 3.5 Flash

如果只做功能验证，不想本地部署模型，可以走 OpenRouter/StepFun 的在线调用。

我的流程如下：

安装 OpenClaw
curl -fsSL https://openclaw.ai/install.sh | bash

运行初始化向导
openclaw onboard
按提示完成初始化，打开 WebUI 进入控制台。

配置模型 Provider
WebUI 路径：Config → Models → Providers → Add Entry
- API Type：openai-completions
- Base URL：https://api.stepfun.ai/v1（国内可用 https://api.stepfun.com/v1，或 OpenRouter 地址）
- API Key：填 StepFun 或 OpenRouter 申请的 Key
- Model ID：step-3.5-flash
保存并刷新，将 Primary Model 设为 step-3.5-flash 即可使用。

小结：OpenClaw 的 Provider 配置采用“OpenAI 兼容”方式，命名和字段与常见 SDK 对齐，整体上手成本不高。

使用体验与观察

交互稳定：多步骤工具调用流程下，失败重试和上下文保持表现稳定。
响应速度：代码生成类任务的首 token 延迟较低，流式响应顺畅。
本地 vs 在线：本地推理更利于隐私与低延迟；在线调用适合快速 PoC 和无需维护算力的团队。
可定制潜力：有了 Base/Midtrain + Steptron，可以按业务场景构建自有训练链路，而不是只能做微调“贴皮”。

落地建议：两种常见路径

快速验证（1–3 天）：OpenClaw + Step 3.5 Flash（OpenRouter/StepFun），完成 Agent 工作流原型验证。
深度定制（2–6 周）：基于 Midtrain 或 Base + Steptron，补齐 SFT/RL/评估，构建域内能力与工具调用策略。

注意事项

合规与隐私：在线调用涉及第三方服务，注意数据脱敏与权限控制；本地部署关注模型权重与数据集许可。
成本与配额：限时免费政策会变化，建议为生产环境准备降级与配额告警机制。
评测与回归：引入自定义数据后，建立任务级评测与回归集，关注多步推理一致性与工具调用失败率。
路线规划：阶跃后续计划开放 RL 和评估模块，SFT 数据将陆续公开，可与团队版本规划同步。

资源链接

GitHub（Step 3.5 Flash）：https://github.com/stepfun-ai/Step-3.5-Flash
Hugging Face（Step 3.5 Flash）：https://huggingface.co/stepfun-ai/Step-3.5-Flash

结尾

从产品视角看，OpenClaw 的爆火让 Agent 研发更易起步，而 Step 3.5 Flash 的“全链路开源”把可控性带给了更多团队：能用、能复现、能迭代。

我的建议是先用在线调用完成流程验证，再根据业务目标选择 Midtrain 或 Base，通过 Steptron 补齐训练与评估。

相较以往只能围着闭源 API 打转，现在我们可以真正把 Agent 能力内化为可持续演进的资产。

以上是这次实践的记录与思考，供你在团队落地时参考。

声明：本站原创文章文字版权归本站所有，转载务必注明作者和出处；本站转载文章仅仅代表原作者观点，不代表本站立场，图文版权归原作者所有。如有侵权，请联系我们删除。

未经允许不得转载：Step 3.5 Flash 全链路开源，冲上 OpenClaw 调用榜

请登录后发表评论