10+年产品经理聊聊产品、测测产品,产品人交流学习成长平台,按 Ctrl+D 收藏我们
关于我 留言板 小程序 标签云

苏米客

  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
  • 登录
  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
当前位置: 首页 » AI最新动态

阿里巴巴通义实验发布全新图像模型:Z-Image(造相),1/3的参数达到商业模型的视觉质量

1月前 AI最新动态 1163 0

阿里巴巴 通义实验)发布了一款名为Z-Image(造相)的高效图像生成基础模型。

  • 模型参数:6B(60亿)

  • 显存占用:16GB以下即可运行

  • 生成速度:8步采样即可出图

  • 支持设备:消费级显卡即可流畅运行

它是通义家族中首个完全开源、支持中英文双语、性能接近 Gemini 的模型系列。

而其中的核心版本 —— Z-Image-Turbo,是它的“极速版”,主打三个关键词:

快 —— 只需 8 步生成高清图像(别人要 30~50 步)。

精 —— 画面写实、光影自然、文字可控(中英双语)。

聪明 —— 能理解复杂指令并准确执行图像变化。

它的核心目标是:

在保持照片级真实感(photorealism)的同时,大幅降低计算和显存成本,
让顶级AI图像生成技术可以在普通显卡上流畅运行(16GB显存即可)。

过去,如果你想要照片级的真实感、准确的中文字渲染,以及复杂的图像编辑能力,往往要依赖几十 GB 显存的大模型。而 Z-Image 只有 6B 参数、16GB 显存即可运行,却能稳定产出能直接用于创意、广告、视觉设计的图像质量。

Z-Image 是什么?为什么值得关注

Z-Image 系列包括两个方向:

模型 用途
Z-Image 标准图像生成
Z-Image-Edit 文字驱动的图像编辑

全系列开源,能跑在 HuggingFace、ModelScope,普通消费级显卡即可流畅推理。
核心版本 Z-Image-Turbo 主打:

  • 快:只要 8 步采样就能出图(主流模型常见 30–50 步)

  • 清晰:真实感强、光影自然

  • 稳:理解复杂指令,编辑任务一致性好

作为习惯跑 20+ 模型的人,我对它的速度提升感知很强。

核心能力

逼真的质量: Z-Image-Turbo 在生成逼真图像的同时保持了出色的美学质量。

准确的双语文本渲染: Z-Image-Turbo 擅长准确渲染复杂的中英文文本。

提示增强与推理: 提示增强器赋予模型推理能力,使其能够超越表面描述,挖掘潜在的世界知识。

创意图像编辑: Z-Image-Edit 对双语编辑指令有很强的理解力,能够实现富有想象力和灵活性的图像变换。

模型架构

我们采用了一种可扩展的单流DiT(S3-DiT)架构。在这种设置中,文本、视觉语义标记和图像VAE标记在序列级别上连接起来,作为统一的输入流,与双流方法相比,最大化了参数效率。

性能

根据基于Elo的人类偏好评估(在AI Arena上),Z-Image-Turbo相对于其他领先模型表现出极高的竞争力,同时在开源模型中取得了最先进的结果。

关键技术亮点

技术 作用
Decoupled-DMD 蒸馏 提升 8 步生成能力(效率 + 质量)
DMDR(蒸馏 + RL) 结构保持更稳定,画面更统一
Prompt Enhancer 自动补全逻辑,提高普通用户的出图成功率

从产品的角度看,这三个技术点都是“提升体验”的核心因素。

性能对比:1/3 计算量 ≈ 商业级质量

在 AI Arena 的 Elo 评估中,Z-Image 在开源模型里是领先水平,同时在一些指标上逼近商业旗舰模型。

这意味着它的“单位显存价值”非常高。

项目资源

GitHub:https://github.com/Tongyi-MAI/Z-Image

HuggingFace 模型:https://huggingface.co/Tongyi-MAI/Z-Image-Turbo

在线体验:

https://huggingface.co/spaces/Tongyi-MAI/Z-Image-Turbo
https://www.modelscope.cn/models/Tongyi-MAI/Z-Image-Turbo

声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
未经允许不得转载:阿里巴巴通义实验发布全新图像模型:Z-Image(造相),1/3的参数达到商业模型的视觉质量
#Z-Image #开源模型 #阿里巴巴 #通义实验 
收藏 1
好玩AI:我用秒哒,零代码开发两款爆火Nano Banana图片生成AI应用
天谱乐:全球首个文本/图片/视频一键成曲的多模态AI音乐创作大模型
推荐阅读
  • Ovis-Image:7B参数文生图模型终结乱码,吊打 GPT-4o AI 生图“文字渲染”新标杆
  • DeepSeek-V3 模型更新版本号 DeepSeek-V3-0324,推理能力、代码编写、中文写作等方面全面提升(提示词分享)
  • 智谱开源 GLM-4.5V:全新视觉推理模型,国产 AI 大模型又炸场了!
  • 从存起来到用起来,ima2.0让知识流动起来
  • Gemini 3 Flash 正式发布,比国产 AI 更便宜,免费、极速、吊打前代
评论 (0)
请登录后发表评论
分类精选
Cursor 限制国内使用 Claude 等模型解决方案!
23382 6月前
学生/非学生:如何申请Cursor Pro免费会员,如何通过SheerID验证快速激活全攻略
22167 8月前
即梦AI图片2.1:一句话快速生成带中文的海报图,免费AI文生图、视频工具、AIGC创作工具
15133 1年前
DeepSeek宣布:降价,最高降价75%!别错过这个优惠时段,赶紧充值
14721 10月前
注意!Cursor单设备登录新规:一个账户最多可以3台设备登录,且限制单点登录
13345 8月前
字节跳动发布"扣子空间":AI协同办公的通用Agent平台开启效率革命
13107 8月前
刚刚!Cursor风控又加强了,可能是因为这个原因!
12374 9月前
Trae国内版,搭载 doubao-1.5-pro、DeepSeek R1/V3模型,对比 Trae 国际版有什么不同
11195 10月前
Cline:自动化编程的VSCode插件Claude Dev + Gemini 2.0,快速构建智能应用
9834 1年前
Trae Pro 来了,终于可以告别排队了!这价格真香
8088 7月前

文章目录

关注「苏米客」公众号

订阅推送更及时,手机查看更方便
分类排行
1 Anthropic 到处封杀!OpenCode打通 ChatGPT 订阅,这波赢麻了!
2 CES 2026 观察:AI 不再是单独的产品,而是硬件的默认引擎
3 智谱上市赠礼活动送旺旺贴!我申请了,你领了吗?
4 腾讯混元超强开源翻译模型 HY-MT1.5:本地部署的多语言翻译、方言,实时翻译
5 人人都是小程序开发者的时代,真的来了(附实战指南)
6 n8n 2.x 重大更新,让工作流走向对话式:Chat Hub、Agent、工作流对话
7 英伟达CES 2026 发布下一代 AI 计算平台 Rubin:六芯片协同设计,AI算力与能效迎来十倍跃迁
8 Claude Code 桌面版发布:本地多会话并行 + 一键云端,AI 编程助理终于融进工作流了
9 2025年度AI报告合集|深度解读行业趋势与技术突破
10 实测 PaddleOCR 3.3:109 种语言与结构化解析,一次部署覆盖大部分文档场景
©2015-2024 苏米客XMSUMI 版权所有 · WWW.XMSUMI.COM 闽ICP备14005900号-6
微信文章助手 程序库 免费影视APP 免费字体下载 Axure RP 10 免费Axure模板 Axure元件库下载 申请友联