10+年产品经理聊聊产品、测测产品,产品人交流学习成长平台,按 Ctrl+D 收藏我们
关于我 留言板 小程序 标签云

苏米客

  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
  • 登录
  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
当前位置: 首页 » AI最新动态

MiMo-V2.5-Pro 开源发布:MIT 协议 + 1M 上下文 + Token 效率超闭源旗舰 60%

1小时前 AI最新动态 16 0

2026 年 4 月 28 日凌晨,小米 MiMo 团队正式发布新一代旗舰模型 MiMo-V2.5-Pro 和 MiMo-V2.5,两个模型全部开源,采用 MIT 协议,可商用、可继续训练、可微调,无需额外授权。

同时发布的还有 Xiaomi MiMo Orbit 百万亿 Token 创造者激励计划,总池子 100T tokens,面向开发者和创作者开放申请。发布后几小时内已被领走 3T 多,剩余约 96.78T。

模型定位与参数

两个模型各有侧重:

  • MiMo-V2.5-Pro:主力模型,1.02T 总参数,激活 42B 的 MoE 架构,主打复杂 Agent 和 Coding 任务
  • MiMo-V2.5:310B 总参数,原生全模态,强调 Agent 能力,是一个 Multimodal Agent

两个模型都支持 1M 上下文窗口。

苏米注:1T 参数 + 1M 上下文 + MIT 协议,这个组合在开源阵营里属于顶级配置。关键是 MIT 协议意味着商用完全没有限制。

Benchmark 表现

按官方 Benchmark 数据,MiMo-V2.5-Pro 对比的对象包括 DeepSeek V4 Pro、Kimi K2.6、GLM 5.1,以及闭源阵营的 Gemini 3.1 Pro、GPT-5.4 和 Claude Opus 4.6。

通用 Agent 能力

MiMo-V2.5-Pro 在三项核心指标上拿到开源第一:

  • GDPVal-AA:Elo 1581(DeepSeek V4 Pro 1554、Kimi K2.6 1480、GLM 5.1 1535;GPT-5.4 1674、Claude Opus 4.6 1606)
  • τ³-bench:72.9(与 GPT-5.4 持平,略高于 Claude Opus 4.6 的 72.4)
  • ClawEval:pass^3 63.8(开源第一,Claude Opus 4.6 为 70.4)

MiMo-V2.5-Pro Benchmark 对比数据

MiMo-V2.5-Pro 详细跑分数据

开源天花板在快速上移,但顶级闭源模型仍有明确的护城河。

Coding 能力

Coding 维度上 MiMo-V2.5-Pro 表现稳健,但未形成碾压:

  • SWE-bench Pro:57.2(Kimi K2.6 58.6、GLM 5.1 58.4)
  • SWE-bench Verified:78.9(DeepSeek V4 Pro 80.6、Kimi K2.6 80.2、Claude Opus 4.6 80.8)
  • Terminal-Bench 2.0:68.4(GLM 5.1 69.0、GPT-5.4 75.1)
  • FrontierSWE:#3.4(GPT-5.4 #1.9、Claude Opus 4.6 #2.0)

在同体量、同价位段的开源模型中,MiMo-V2.5-Pro 处于第一梯队。

Token 效率:核心差异化

此次发布最值得关注的指标是Token 效率。

官方数据显示,MiMo-V2.5-Pro 在 ClawEval 上做到 64% Pass^3,平均每条轨迹只花约 70K tokens。同样的任务,Claude Opus 4.6、Gemini 3.1 Pro、GPT-5.4 大概要多花 40% 到 60% 的 token。

Token 效率对比图

苏米注:对企业用户来说,这是一笔很实在的账。Agent 任务跑长程,token 消耗几乎和钱包一比一挂钩。同样的预算下能多跑 50% 的任务,比榜单上多 1 分实用得多。

技术架构

MiMo-V2.5-Pro 的技术架构亮点:

  • 70 层 MoE:1 层 dense + 69 层 MoE,每层 384 个路由专家、每个 token 激活 8 个专家
  • 混合注意力:滑动窗口注意力(SWA)和全局注意力(GA)按 6:1 交错,SWA 窗口 128,KV 缓存存储减少约 7 倍
  • 3 层 MTP:Multi-Token Prediction 模块,推理速度提升 3 倍
  • 预训练:27T tokens,全程 FP8(E4M3)混合精度
  • 后训练:三段式——SFT 建立指令跟随 → 大规模 Agent RL 和领域专家训练 → MOPD 多教师蒸馏

MiMo-V2.5-Pro 技术架构图

实战案例

官方展示了几个令人印象深刻的长程任务案例:

  • 4.3 小时 写完 SysY 语言的 Rust 编译器,调用 672 次工具,233 个测试用例全过
  • 11.5 小时 生成 8192 行代码的视频编辑器,工具调用 1868 次
  • 1 小时 完成 FVF-LDO 模拟电路设计优化

Rust 编译器实战案例

电路设计优化案例

千次级别工具调用的长程任务,过去一年是开源模型的明显短板。MiMo-V2.5-Pro 把工程指标推到这个量级,证明开源阵营在 long-horizon agent 赛道上已经追了上来。

生态与部署

发布当天,SGLang 和 vLLM 就完成了适配,开发者直接拉镜像即可运行。

芯片侧 Day-0 适配清单包括:AWS、AMD、平头哥、昆仑芯、燧原、沐曦、天数智芯,从云端 GPU 到自研加速器全覆盖。

权重和代码已上传 Hugging Face(XiaomiMiMo 账号)。官方提供 API 平台(platform.xiaomimimo.com)和 AI Studio(aistudio.xiaomimimo.com),不想自己部署的用户可直接调用。

客观评价

亮点

  • MIT 协议彻底放开商用
  • 1M 上下文窗口
  • 千次工具调用级别的长程能力
  • Token 效率比闭源旗舰省 40% 到 60%
  • 百万亿 Token 创造者激励池

需要注意的地方

  • 与顶尖闭源仍有差距:GPT-5.4 在 GDPVal-AA、Humanity's Last Exam、Terminal-Bench 2.0 上明显领先,Claude Opus 4.6 在 GDPVal-AA、ClawEval 上分别领先 25 分和 7 分
  • Coding 维度未形成碾压:SWE-bench Pro 上不如 Kimi K2.6 和 GLM 5.1,核心场景是写代码的团队需对比测试
  • 部署门槛高:1.02T 参数的 MoE 至少需要 16 张 H100 级别显卡,个人开发者本地运行不现实

总结

从 2026 年 1 月至今,DeepSeek V4、Kimi K2.6、GLM 5.1,再到 MiMo-V2.5-Pro,开源大模型的迭代密度在加速。每一家都在堆参数、拉上下文、推 Agent 能力,并且都把 token 效率作为新的差异化卖点。

对于 Agent 团队来说,MiMo-V2.5-Pro 是一个真正能打的开源旗舰选择。对预算有限的团队,建议先用 API 或 AI Studio 体验,看到真实业务收益后再考虑申请 Orbit 激励池或自建集群。

声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
未经允许不得转载:MiMo-V2.5-Pro 开源发布:MIT 协议 + 1M 上下文 + Token 效率超闭源旗舰 60%
#MiMo-V2.5 #小米 #开源 #Agent 
收藏 1
CodeBuddy国内版与国际版对比:模型、功能、计费全解析
这是最后一篇
推荐阅读
  • 刚刚,DeepSeek V3.2 正式发布:强化 Agent 能力,融入思考推理,支持工具调用
  • KAT-Coder-Pro V2发布:Claude Code + KAT-Coder-Pro V2实测新一代代码助手在前端生成与审美上显著进化
  • Lingma IDE:又一款完全免费的 AI 编程 IDE,智能体+MCP开箱即用
  • IMA 任务模式开放体验(邀请码):高校教师三类开学任务更高效
  • 我用 Google 最新版 Stitch 和 AI Studio Build 打通原型、设计系统与应用生成
评论 (0)
请登录后发表评论
分类精选
Cursor 限制国内使用 Claude 等模型解决方案!
28671 9月前
学生/非学生:如何申请Cursor Pro免费会员,如何通过SheerID验证快速激活全攻略
26270 11月前
即梦AI图片2.1:一句话快速生成带中文的海报图,免费AI文生图、视频工具、AIGC创作工具
17763 1年前
注意!Cursor单设备登录新规:一个账户最多可以3台设备登录,且限制单点登录
17726 1年前
DeepSeek宣布:降价,最高降价75%!别错过这个优惠时段,赶紧充值
15352 1年前
Trae国内版,搭载 doubao-1.5-pro、DeepSeek R1/V3模型,对比 Trae 国际版有什么不同
14268 1年前
刚刚!Cursor风控又加强了,可能是因为这个原因!
13988 1年前
字节跳动发布"扣子空间":AI协同办公的通用Agent平台开启效率革命
13763 1年前
字节推出Trae CLI :Claude Code 和 Gemini CLI的国产平替 ?手把手教你如何安装Trae Agent
13283 9月前
Cline:自动化编程的VSCode插件Claude Dev + Gemini 2.0,快速构建智能应用
11685 1年前

文章目录

关注「苏米客」公众号

订阅推送更及时,手机查看更方便
分类排行
1 MiMo-V2.5-Pro 开源发布:MIT 协议 + 1M 上下文 + Token 效率超闭源旗舰 60%
2 Claude 桌面版支持第三方模型:Cowork 和 Code 模式全面开放
3 GPT-5.5 与 DeepSeek V4 同日发布:价格 8.5 倍差距背后的 AI 格局变化
4 小米 MiMo-V2.5 开源 + Orbit 百万亿 Token 计划:面向 AI Builder 的生态布局
5 阿里HappyHorse(快乐小马)首发体验:视频生成效果不输即梦,价格也要跟上?
6 DeepSeek V4 发布:两款模型怎么选,以及怎么接入 API?
7 GPT-image-2 生成图片怎么识别?C2PA 内容凭证详解
8 火山方舟 vs 阿里百炼 Coding Plan 全模型实测对比,实际使用体验有多大差距?
9 GPT-5.5正式发布:全面超越 Claude Opus 4.7,重新夺回 SOTA 宝座
10 OpenAI Workspace Agents 发布:一句话为团队创建 AI Agent,5 月 6 日前免费
©2015-2024 苏米客XMSUMI 版权所有 · WWW.XMSUMI.COM 闽ICP备14005900号-6
微信文章助手 程序库 免费影视APP 免费字体下载 Axure RP 10 免费Axure模板 Axure元件库下载 申请友联