10+年产品经理聊聊产品、测测产品,产品人交流学习成长平台,按 Ctrl+D 收藏我们
关于我 留言板 小程序 标签云

苏米客

  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
  • 登录
  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
当前位置: 首页 » AI最新动态

腾讯开源混元图像模型 3.0(HunyuanImage 3.0),免费开放使用!

14小时前 AI最新动态 234 0

混元图像3.0,来了,而且还是开源,直接免费开放使用!

腾讯开源旗下混元 3.0 模型(HunyuanImage 3.0),参数量 80B,据官方介绍说是目前效果最好的开源生图模型,整体效果和头部闭源模型相差不大。

原生多模态

据官方介绍中强调原生多模态,这指的是在技术架构上,通过一个模型完成文字、图片、视频与音频等多个模态的输入与输出,而非通过多个模型的组合实现图文理解、图片生成等任务。

这意味着,混元图像3.0不仅拥有生图模型的画画能力,还具备语言模型的思考能力和常识。它就像一个自带“大脑”的画家,可以利用智能去思考图像的布局、构图、笔触,利用世界知识去推理常识性的画面

作为原生多模态开源模型,混元图像3.0需要对模型整体架构进行重构,以支持多任务的训练,并实现多任务效果之间的相互促进。

混元图像3.0以Hunyuan-A13B为基础,基于50亿量级的图文对,视频帧,图文交织数据和6T的语料数据进行了多模态生成、理解和LLM的混合训练,使得模型能够充分融合多任务效果,实现超强的语义理解能力,能够响应复杂的长文本,生成长文本文字,同时具有LLM的世界知识,能够利用世界知识进行推理。

腾讯混元团队透露,混元图像3.0目前的版本仅开放了文生图能力,图生图、图像编辑、多轮交互等版本将于后续发布。

技术特点

  • 原生多模态架构:支持文本、图像、视频、音频的统一建模,而非模型拼接。

  • 语义与推理能力:可解析千字级复杂语义,具备LLM常识推理能力。

  • 图像生成质量:高美学质感,真实高质感画面,支持复杂长文本渲染。

  • 训练数据:基于 Hunyuan-A13B,使用 50亿图文对 + 视频帧 + 6T语料,进行多模态与LLM混合训练。

支持生成

  • 复杂文本类图片(带小字、长段文字的海报等);

  • 漫画/插画/表情包(如四格科普漫画、九宫格表情包);

  • 产品广告与高端摄影风格图片;

  • 创意艺术风格(插画、手账风格、时尚大片)。

使用体验

网页端直接打开 腾讯混元官网 -> 视觉生成即可进入(同时还支持小程序端,可以直接在微信搜索「腾讯混元」即可)

体验入口:https://hunyuan.tencent.com/visual

通过最新上线的这个入口进入就默认是「HunyuanImage3.0」模型了

测试一下官方推荐的提示词:你是一个小红书穿搭博主,请根据模特穿搭生成一张封面图片,要求: 1.画面左侧是模特的OOTD全身图 2.右侧是衣服的展示,分别是上衣深棕色夹克、下装黑色百褶短裙、棕色靴子、黑色包包 风格:实物摄影,要求真实,有氛围感,秋季酷感穿搭,看看生成效果:

复杂文字封面/海报提示词:封面设计,标题:AI 编程正在重塑产品经理,副标题:为什么 AI 编程最适合懂技术的产品经理,特写:一个产品经理正在思考AI编程工具,背景:各种AI编程工具如Cursor、Qoder、TRAE、CodeBuddy,要求:背景模糊处理,标题清晰醒目,用海报设计字体

生成九宫格人物手办:生成九宫格的9个系列盲盒手办,要求不同动作的,可爱蓝色的风格的设计感,Q版人物,每一款手办是不一样的造型,展示背景是一个温馨的桌面

加大难度,设计长文海报排版:

设计一张活动海报,分为两个视觉层次:「背景图」和「前景文字排版」。 文字排版风格:现代主义风格,使用清晰、无衬线字体,网格布局,具有层次感。 保持良好留白,文字不要遮挡关键图像区域。 内容如下(如果空白就你来补充,改成中文):活动主题:活动时间:活动地点:邀请嘉宾(用三个照片)

总结

测试完后,我总体感觉是整体能力有了非常大的提升和飞跃,现在只体验了文生图,像图生图,图片编辑还无法体验到,但开源的想象空间非常大!

80B的大模型自己部署 至少要 4 张 80GB的显卡,个人电脑肯定是跑不起来的,所以还是只能在线上体验了!

如果想要自己部署的话看下面:

Github:https://github.com/Tencent-Hunyuan/HunyuanImage-3.0

Hugging Face:https://huggingface.co/tencent/HunyuanImage-3.0

同时官方还有提示词手册,大家也可以参考一下

提示词手册:https://docs.qq.com/doc/DUVVadmhCdG9qRXBU

声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
未经允许不得转载:腾讯开源混元图像模型 3.0(HunyuanImage 3.0),免费开放使用!
#混元图像模型 #混元图像 #腾讯混元 #开源模型 
收藏 1
DeepSeek-V3.2-Exp模型正式发布,性能不变,API价格大幅下调50%
智谱GLM-4.6 发布,国产最强模型上新,而且开源!
推荐阅读
  • 即梦4.0上手体验:六大场景实测,中文创作者的福音,全面硬刚NanoBanana
  • MiniMax五连发:MiniMax-M1、MiniMax Agent、Hailuo 02、Video Agent、Audio语音定制
  • AI搜索3.0时代来了?360纳米AI超级搜索智能体深度体验报告
  • 学生/非学生:如何申请Cursor Pro免费会员,如何通过SheerID验证快速激活全攻略
  • 微软版"SOLO"来了!GitHub Spark让零代码开发应用成为现实
评论 (0)
请登录后发表评论
分类精选
Cursor 限制国内使用 Claude 等模型解决方案!
18804 2月前
学生/非学生:如何申请Cursor Pro免费会员,如何通过SheerID验证快速激活全攻略
16668 4月前
DeepSeek宣布:降价,最高降价75%!别错过这个优惠时段,赶紧充值
14165 7月前
字节跳动发布"扣子空间":AI协同办公的通用Agent平台开启效率革命
12259 5月前
即梦AI图片2.1:一句话快速生成带中文的海报图,免费AI文生图、视频工具、AIGC创作工具
12042 9月前
刚刚!Cursor风控又加强了,可能是因为这个原因!
10427 5月前
Trae国内版,搭载 doubao-1.5-pro、DeepSeek R1/V3模型,对比 Trae 国际版有什么不同
9288 7月前
注意!Cursor单设备登录新规:一个账户最多可以3台设备登录,且限制单点登录
8830 5月前
Cline:自动化编程的VSCode插件Claude Dev + Gemini 2.0,快速构建智能应用
8567 9月前
字节全新AI编程 IDE:Trae!性能对标Cursor,标配Claude 3.5和GPT-4o,免费无限量
5935 8月前

文章目录

关注「苏米客」公众号

订阅推送更及时,手机查看更方便
分类排行
1 智谱GLM-4.6 发布,国产最强模型上新,而且开源!
2 即梦悄悄上线数字人新模型OmniHuman 1.5,会跑会跳,能唱能演,还能变脸
3 腾讯开源混元图像模型 3.0(HunyuanImage 3.0),免费开放使用!
4 DeepSeek-V3.2-Exp模型正式发布,性能不变,API价格大幅下调50%
5 Anthropic发布Claude Sonnet 4.5,代码能力超越 GPT-5,这次更新不止是模型!
6 Kimi全新Agent模型OK Computer发布并开启订阅
7 Google Vids:AI数字人制作体验,vids .new免费制作数字人
8 非程序员也能玩黑客松,中国首届非程序员黑客松大赛
9 DeepSeek V3.1-Terminus 发布:语言一致性与智能代理的双重进化
10 阿里 Qwen3 系列新模型:全模态AI,规模最大、能力最强的模型
©2015-2024 苏米客XMSUMI 版权所有 · WWW.XMSUMI.COM 闽ICP备14005900号-6
程序库 免费影视APP 花式玩客 免费字体下载 产品经理导航 Axure RP 10 免费Axure模板 Axure原型设计 Axure元件库下载 申请友联