10+年产品经理聊聊产品、测测产品,产品人交流学习成长平台,按 Ctrl+D 收藏我们
关于我 留言板 小程序 标签云

苏米客

  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
  • 登录
  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
当前位置: 首页 » AI最新动态

Google Gemma 4 发布:31B 参数开源第一梯队,代码能力提升 19 倍,改用 Apache 2.0 许可证

1小时前 AI最新动态 5 0

今天凌晨,Google DeepMind 发布了新一代开源模型 Gemma 4,以 30B 左右的参数,逼近其他头部开源模型。

图片

Gemma 是 Google 的开源模型系列,和闭源旗舰 Gemini 共享底层技术,权重完全公开,任何人可以下载、修改、部署。上一代 Gemma 3 是 2025 年 3 月发布的,到这次更新整整一年。

苏米注:在这一年里,国内几家开源模型已经迭代了好几轮,Google 在开源赛道的存在感越来越弱。这次 Gemma 4 的发布,算是 Google 的强势回归。

四款模型规格

Gemma 4 发布了四个版本,分大模型组和小模型组,覆盖了手机到工作站全场景。

31B Dense(旗舰版)

  • 310 亿参数全激活,60 层,256K 上下文
  • 追求质量上限,Arena AI 开源排行榜第三
  • 未量化 bfloat16 权重一张 80GB H100 就能装下,量化后消费级显卡也能跑

26B A4B MoE(性价比之选)

  • 252 亿总参数、38 亿激活参数,MoE 架构(128 个专家,每次激活 8 个 +1 个共享)
  • 30 层,256K 上下文,推理速度接近 4B 模型,质量远超 4B 水平
  • Arena AI 开源排行榜第六

图片

E4B(端侧高效版)

  • 80 亿总参数、45 亿有效参数,42 层,128K 上下文
  • E 代表 Effective,小模型用了 Per-Layer Embeddings 技术,有效参数远小于总参数

E2B(超轻量版)

  • 51 亿总参数、23 亿有效参数,35 层,128K 上下文
  • 在部分设备上内存占用可以压到 1.5GB 以下

图片

所有模型都支持图像和视频输入,支持 140 多种语言。各模型均为多模态,小模型支持语音输入,大模型反而不支持。

E2B 和 E4B 各自带了一个约 3 亿参数的音频编码器,可以做语音识别和语音翻译(最长 30 秒)。Google 和 Pixel 团队、高通、联发科合作优化了端侧部署,E2B 和 E4B 可以在手机、树莓派、NVIDIA Jetson Orin Nano 上完全离线运行。

图片

Benchmark 成绩

相比上一代 Gemma 3 27B,多个核心指标的提升是代际级别的。

测试项目 Gemma 3 27B Gemma 4 31B 提升幅度
数学 (AIME 2026) 20.8% 89.2% 4.3 倍
代码 (Codeforces ELO) 110 2150 19.5 倍
代码 (LiveCodeBench v6) 29.1% 80.0% 2.7 倍
综合推理 (GPQA Diamond) 42.4% 84.3% 2 倍
综合推理 (MMLU Pro) 67.6% 85.2% 26%
视觉 (MMMU Pro) 49.7% 76.9% 55%
文档 OCR (OmniDocBench) 0.365 0.131 64% 降低
长上下文 (MRCR v2 128K) 13.5% 66.4% 4.9 倍
多语言 (MMMLU) 70.7% 88.4% 25%

苏米注:代码能力是这次进步最大的方向,Codeforces ELO 从 110 拉到 2150,这个提升幅度非常惊人。

26B MoE 和 31B 在大部分指标上只差 2 到 5 个百分点,但推理速度快得多。延迟敏感的场景下 26B MoE 性价比更高。

E4B 的 MMLU Pro 69.4%,有效参数只有 45 亿,接近上一代 27B 的水平。

图片

核心能力详解

推理和思考

四款模型都内置了可开关的思考模式,开启后模型先输出内部推理再给答案。数学、逻辑、多步骤规划类任务效果好很多,和 Gemini 的 thinking 能力同源。

Agent 工作流

原生支持函数调用和结构化 JSON 输出,可以让模型调用外部工具和 API。Google 同步发布了 Agent Development Kit(ADK),一个开源的 Agent 框架。端侧 E2B/E4B 也能跑 Agent,Google AI Edge Gallery 里已有示范应用。

代码生成

支持离线写代码。Codeforces ELO 2150、LiveCodeBench 80.0%,在代码补全和生成场景里是可用的。

多模态理解

所有模型都能处理图片和视频(视频按帧处理,最长 60 秒)。图片支持可变分辨率和宽高比,视觉 token 预算可手动配置(70 到 1120 五档),低预算换速度,高预算换精度。OCR、文档解析、图表理解是重点场景。

长文档处理

大模型 256K 上下文,小模型 128K。架构上用混合注意力机制(局部滑动窗口 + 全局注意力交替),全局层用统一 KV 和 Proportional RoPE 优化长上下文的内存占用。

多语言支持

原生训练 140 多种语言,MMMLU 88.4%。

Apache 2.0 许可证

之前 Gemma 1/2/3 用的都是 Google 自己的许可协议,虽然允许商用但有附加条款。这次直接换成了 Apache 2.0,开源社区最认可的商业友好型许可证之一。开发者可以自由修改、分发、商用,没有用户量门槛。

Hugging Face 联合创始人 Clément Delangue 评价这是一个重大里程碑。从 Gemma 系列自身看(三代自定义协议 → Apache 2.0),这是一个明确的转向。

苏米注:Google 用许可证的选择回答了一个讨论了两年的问题:大厂做开源到底有多大诚意。Apache 2.0 的采用,说明 Google 这次是认真的。

开源赛道的竞争格局

Arena AI 开源排行榜上,Gemma 4 31B 排第三、26B MoE 排第六。排在前面的主要是国内的开源模型。

目前开源赛道的主要竞争者:

  • DeepSeek:V3.2 在用,V4 即将发布
  • 通义千问 Qwen3.5
  • 智谱 GLM-5.1
  • MiniMax M2.5
  • 月之暗面 Kimi K2.5

这几家在今年春节前后密集发布了新版本,参数量从几百亿到上千亿不等,在推理、代码、Agent 等方向各有侧重。

Gemma 4 最大只有 31B,参数量的天花板是一个限制。但 Gemma 4 在端侧部署的工程完整度上做得最深:和高通、联发科的芯片级合作,和 Android 生态的原生打通,加上 Apache 2.0 的合规便利,这些是它的差异化优势。

图片

去哪里用

在线体验:Google AI Studio(31B、26B),Google AI Edge Gallery App(E4B、E2B)

模型下载:Hugging Face、Kaggle、Ollama

云端部署:Vertex AI、Cloud Run、GKE

Android 开发:AICore Developer Preview(和 Gemini Nano 4 前向兼容)

推理框架:Hugging Face Transformers、vLLM、llama.cpp、MLX、Ollama、NVIDIA NIM、LM Studio、Unsloth、SGLang 等

Gemma 系列到目前累计超过 4 亿 次下载,社区产出超过 10 万 个变体。Kaggle 上同步启动了 Gemma 4 Good Challenge,鼓励用 Gemma 4 做有社会价值的项目。

总结

Gemma 4 的发布标志着 Google 在开源模型赛道的强势回归。虽然参数量不是最大的,但在代码能力、端侧部署、Apache 2.0 许可证等方面有明显优势。对于需要离线部署、端侧运行的开发者来说,Gemma 4 是一个值得考虑的选择。

最佳实践:桌面端推荐 26B MoE(性价比高),移动端推荐 E2B/E4B(内存占用低),追求极致效果选 31B Dense。

声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
未经允许不得转载:Google Gemma 4 发布:31B 参数开源第一梯队,代码能力提升 19 倍,改用 Apache 2.0 许可证
#Google Gemma 4 #开源模型 #AI 编程 #Apache 2.0 
收藏 1
小米 MiMo Token Plan 上线:39 元起订阅,1M 上下文全模态共享额度
这是最后一篇
推荐阅读
  • 智谱发布 ZCode 编辑器:Claude Code、Codex、Gemini顶级AI编程无缝切换的可视化Agent
  • 英伟达CES 2026 发布下一代 AI 计算平台 Rubin:六芯片协同设计,AI算力与能效迎来十倍跃迁
  • Windsurf Wave 8 重新定义AI编辑器,自定义工作流与多线程模式的革新
  • 两款Cursor账号切换器:本地号池一键切换管理, Cursor白嫖试用继续!
  • 谷歌这波太狠了!谷歌I/O 2025 AI全面爆发,Gemini 2.5 Pro、AI Agents、XR眼镜…开启AI新纪元
评论 (0)
请登录后发表评论
分类精选
Cursor 限制国内使用 Claude 等模型解决方案!
27083 8月前
学生/非学生:如何申请Cursor Pro免费会员,如何通过SheerID验证快速激活全攻略
25182 11月前
即梦AI图片2.1:一句话快速生成带中文的海报图,免费AI文生图、视频工具、AIGC创作工具
17130 1年前
注意!Cursor单设备登录新规:一个账户最多可以3台设备登录,且限制单点登录
16722 11月前
DeepSeek宣布:降价,最高降价75%!别错过这个优惠时段,赶紧充值
15113 1年前
刚刚!Cursor风控又加强了,可能是因为这个原因!
13605 11月前
字节跳动发布"扣子空间":AI协同办公的通用Agent平台开启效率革命
13599 11月前
Trae国内版,搭载 doubao-1.5-pro、DeepSeek R1/V3模型,对比 Trae 国际版有什么不同
13026 1年前
字节推出Trae CLI :Claude Code 和 Gemini CLI的国产平替 ?手把手教你如何安装Trae Agent
11646 8月前
Cline:自动化编程的VSCode插件Claude Dev + Gemini 2.0,快速构建智能应用
11340 1年前

文章目录

关注「苏米客」公众号

订阅推送更及时,手机查看更方便
分类排行
1 Google Gemma 4 发布:31B 参数开源第一梯队,代码能力提升 19 倍,改用 Apache 2.0 许可证
2 小米 MiMo Token Plan 上线:39 元起订阅,1M 上下文全模态共享额度
3 KAT-Coder-Pro V2发布:Claude Code + KAT-Coder-Pro V2实测新一代代码助手在前端生成与审美上显著进化
4 Claude Code的Harness Engineering公开后,全世界的 Agent 能力提高了一个档次
5 OpenClaw 官方在 X 平台正式宣布:旗下技能市场 ClawHub 推出中国官方镜像站,附中文界面,国内访问不再受限
6 Claude Code 源码大泄露,我看到了 AI Agent 即将爆发的 7 大能力
7 智谱 GLM-5V-Turbo 发布:原生多模态 Coding 基座模型
8 智谱推出 Super Z:微信、飞书直接对话 GLM-5,零配置使用大模型
9 阿里 Wan2.7-Image 实测:AI 捏脸、调色盘、3K 文本渲染、交互式编辑全评测
10 Claude Code 正式推出全自动模式 Auto mode:AI 全权接管权限审核,兼顾高自由度与零误操
©2015-2024 苏米客XMSUMI 版权所有 · WWW.XMSUMI.COM 闽ICP备14005900号-6
微信文章助手 程序库 免费影视APP 免费字体下载 Axure RP 10 免费Axure模板 Axure元件库下载 申请友联