10+年产品经理聊聊产品、测测产品,产品人交流学习成长平台,按 Ctrl+D 收藏我们
关于我 留言板 小程序 标签云

苏米客

  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
  • 登录
  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
当前位置: 首页 » AI最新动态

MiniCPM5-1B 开源:1B 参数的端侧 AI 桌宠

4小时前 AI最新动态 37 0

MiniCPM5-1B:1B 参数的端侧基座模型,AA 榜单 2B 以下最强

5 月 25 日至 29 日,面壁智能与 OpenBMB 联合举办「端侧大模型开源周」,每天发布一个端侧大模型的关键能力。第二弹推出的 MiniCPM5-1B 是由面壁智能联合清华大学、OpenBMB 开源社区发布的新一代端侧文本基座大模型,仅 1B 参数规模,在 Artificial Analysis Intelligence Index(AA-Index)上超越了所有 2B 参数以下的模型,得分 17.9 分位列小尺寸模型第一。

相比 3 个月前发布的 Qwen3.5-2B,MiniCPM5-1B 效果更优,参数量减少一半。这一结果验证了智能密度定律:大模型的智能密度正以约每 3.5 个月翻一番的速度持续提升。

图片 1

1B 参数能做什么:AI 桌宠

MiniCPM5-1B 的一个典型应用是「AI 桌宠」——跑在手机、电脑或浏览器里的轻量级 AI 陪伴应用。项目基于 clawd-on-desk 二次开发,GitHub 地址:OpenBMB/MiniCPM-Desk-Pet。

部署成本几乎可以忽略:不需要 GPU 集群,不需要云端 API,一台普通笔记本、一部手机、甚至一个浏览器标签页就能运行。INT4 量化后权重仅 0.5GB,断网也能跑。

苏米注:端侧 AI 的核心价值不是把云端大模型打折后塞进小设备,而是让适配端侧环境的小尺寸模型本身就足够强,强到能独立驱动真实应用。MiniCPM5-1B 正是这个方向的最新验证。

评测表现:全面超越同尺寸模型

在综合知识、数学推理、代码推理、工具调用等维度上,MiniCPM5-1B 全面超越 Qwen3.5-0.8B、LFM2.5-1.2B-Thinking 等同尺寸基座模型。这不是某个单项上的微弱领先,而是全面、系统性的超越。

图片 2

在 AA 榜单的散点图中,MiniCPM5-1B 位于「最具吸引力象限」——高智能指数、低参数量,参数效率显著优于同级模型。

图片 3

另一张散点图展示了智能指数与输出令牌消耗量的关系,MiniCPM5-1B 同样位于高效率区域。

图片 4

数据治理:高智能密度的关键

1B 模型要达到出色性能,训练数据的质量比参数量更重要。MiniCPM5-1B 在训练中构建了分级数据治理体系,将预训练数据按质量划分为 L0 至 L4 五个等级,每级对应不同的清洗、筛选和质量控制标准。

研究团队针对三个关键语料方向开展了大规模高质量数据合成:

  • 高知识密度中文网页语料
  • 高知识密度英文网页语料
  • 高质量数学合成语料

核心理念是:与其用海量低质数据灌出一个模型,不如用精选高密度数据养出一个模型。高质量合成数据集 Ultra-FineWeb-L3 将随模型一起开源。技术报告:arxiv.org/pdf/2602.09003。

ForgeTrain:AI 编写的训练框架

MiniCPM5-1B 的 Base Model 版本由面壁智能自主研发的 AI 训练框架 ForgeTrain 在华为昇腾上预训练完成。ForgeTrain 是全球首个完全由 AI 编写的生产级大模型训练框架,零人类程序员参与编写框架代码。

在英伟达 H100 上,ForgeTrain 的训练速度比英伟达 Megatron 框架快 10%,相当于训练成本下降 10%。这组数据进一步验证了「AI 制造 AI」的路径可行性——一个完全由 AI 编写的训练框架,能够训练出全球同尺寸最优的基座模型。

端侧部署:0.5GB 跑满全平台

MiniCPM5-1B 的部署门槛极低,覆盖从服务器到手机的全场景:

图片 5

  • 有 GPU:直接跑 FP16,性能拉满,权重约 2GB
  • 只有 CPU:面壁智能联合清华大学、OpenBMB 开源了自研 CPU 推理框架 ArcLight,专门为纯 CPU 环境做了深度优化
  • 浏览器运行:可直接在浏览器中运行,零安装、零配置

苏米注:INT4 量化后仅 0.5GB,比一部短视频还小。这意味着普通用户的手机就能本地运行一个能力出色的文本大模型,不需要任何云端依赖。

开发者友好:一行代码唤醒桌宠

MiniCPM5-1B 从设计之初就围绕开发者友好来设计:

  • 主流微调框架全覆盖:支持 Llama_factory、ms_swift
  • 推理框架适配:SGLang、vLLM、llama.cpp、ollama、Hugging Face、ArcLight
  • 安装 Skills:如果使用 Claude Code 或类似 AI 编程工具,可以直接让 AI 帮你完成环境配置和部署

开源地址

  • HuggingFace:openbmb/MiniCPM5-1B
  • GitHub:OpenBMB/MiniCPM
  • ModelScope:MiniCPM5-1B
  • GitCode:MiniCPM5-1B
  • 魔乐社区:MiniCPM5-1B
声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
未经允许不得转载:MiniCPM5-1B 开源:1B 参数的端侧 AI 桌宠
#MiniCPM5-1B #端侧AI #开源模型 #AI桌宠 #ForgeTrain 
收藏 1
garden-skills:25 种风格配方解决 AI 前端审美同质化,6.2K Star 的 Agent Skills 集合
这是最后一篇
推荐阅读
  • Codex 插件系统详解:将 Skills、应用集成与 MCP 打包成可复用工作流
  • 突发!Anthropic收购 Bun!Claude Code 半年营收破10 亿美金
  • 快手发布 AI 编程矩阵:AI编程工具 CodeFlicker、自研的大模型 KAT-Coder
  • 重磅更新:Claude 现可接管整台电脑,鼠标、键盘与屏幕一体化操控
  • Google AI Studio 新发布了一款 Vibe Coding 产品
评论 (0)
请登录后发表评论
分类精选
Cursor 限制国内使用 Claude 等模型解决方案!
30232 10月前
学生/非学生:如何申请Cursor Pro免费会员,如何通过SheerID验证快速激活全攻略
27253 1年前
注意!Cursor单设备登录新规:一个账户最多可以3台设备登录,且限制单点登录
18805 1年前
即梦AI图片2.1:一句话快速生成带中文的海报图,免费AI文生图、视频工具、AIGC创作工具
18765 1年前
DeepSeek宣布:降价,最高降价75%!别错过这个优惠时段,赶紧充值
15806 1年前
Trae国内版,搭载 doubao-1.5-pro、DeepSeek R1/V3模型,对比 Trae 国际版有什么不同
15339 1年前
字节推出Trae CLI :Claude Code 和 Gemini CLI的国产平替 ?手把手教你如何安装Trae Agent
14884 10月前
刚刚!Cursor风控又加强了,可能是因为这个原因!
14489 1年前
字节跳动发布"扣子空间":AI协同办公的通用Agent平台开启效率革命
14041 1年前
Cline:自动化编程的VSCode插件Claude Dev + Gemini 2.0,快速构建智能应用
12232 1年前

文章目录

关注「苏米客」公众号

订阅推送更及时,手机查看更方便
分类排行
1 MiniCPM5-1B 开源:1B 参数的端侧 AI 桌宠
2 DeepSeek API 永久降价:从 78 元到 9 元,大模型价格战进入新阶段
3 Anthropic 联合创始人 Chris Olah 在梵蒂冈 AI 通谕发布会上的发言要点
4 Qwen 3.7-Max上线百炼平台:性能超越GLM-5.1,Qwen市场关注度待观察
5 千问云正式上线:一个 API Key 打通 150+ AI 模型,阿里 MaaS 平台全面开放
6 Anthropic 3 亿美元收购 Stainless:MCP 生态的接口革命
7 OpenCode Go:10 美元/月的统一模型订阅,值得重度开发者入手吗?
8 Codex 6连更:AI 看屏、锁屏控制、自主干一整天
9 Gemini 3.5 Flash发布:速度碾压GPT但价格翻3倍开发者炸锅
10 智谱 GLM-5.1 高速版上线,全球最快旗舰API,7倍提速开始喷代码
©2015-2024 苏米客XMSUMI 版权所有 · WWW.XMSUMI.COM 闽ICP备14005900号-6
微信文章助手 程序库 免费影视APP 免费字体下载 Axure RP 10 免费Axure模板 Axure元件库下载 申请友联