10+年产品经理聊聊产品、测测产品,产品人交流学习成长平台,按 Ctrl+D 收藏我们
关于我 留言板 小程序 标签云

苏米客

  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
  • 登录
  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
当前位置: 首页 » AI最新动态

阿里发布AI 图像编辑模型Qwen‑Image‑Edit,真的够用吗?

2小时前 AI最新动态 26 0

昨天在测试Qwen‑Image的生图API,发现社区模型库又有新品!刚上线的Qwen‑Image‑EditAI 图像编辑模型,刚好有时间就来瞧瞧这款刚上线的图像编辑模型有什么新花样~

第一时间上手体验一把,发现,还真有两把刷子~

从生成到精准修图

和市面上那些专注"从0到1"生成图片的AI工具不同,Qwen-Image-Edit主攻的是图像编辑。用我们产品经理的话来说,这就是从MVP(最小可行产品)到PMF(产品市场匹配)的差别。

根据阿里官方介绍,这个模型最有意思的地方是它的"双输入"设计架构:将输入图像同时馈送到Qwen2.5-VL(用于视觉语义控制)和VAE编码器(用于视觉外观控制)。

简单来说,就是一个负责"理解你想干什么",另一个负责"保证改完还像原来的"。这种设计让我想起了我们做产品时的用户体验设计原则:既要满足用户需求,又要保持产品的一致性体验。

作为一个经常需要修改各种宣传物料的打工人,我对它最感兴趣的是中英文文字编辑能力。毕竟谁没有遇过海报上的错别字、或者需要临时改个文案颜色的尴尬时刻呢?

三大核心功能

1. 中英文字精准编辑

这个功能对我这种经常需要调整文案的人来说,简直是福音。官方介绍中提到,"Qwen-Image-Edit支持双语(中文和英文)文本编辑,允许直接在图像中添加、删除和修改文本,同时保留原始字体、大小和样式"。

我试着用它修改了几张海报,包括改错别字、换颜色、调整文案内容。最让我印象深刻的是,它真的能保持原有的字体风格和排版,不会出现那种"一眼就能看出是后期P上去"的违和感。

从官方展示的案例来看,无论是英文海报的标题修改,还是中文书法作品的字符纠错,都能做到相当精准的处理。

举个例子,我有张海报需要把"Cursor"改成"CodeBuddy",用传统方法要么重新设计,要么用PS慢慢抠。

但用Qwen-Image-Edit,几秒钟就搞定了,字体、大小等效果都完美匹配,还是高清图。

2. 语义级图像改写

官方对这个功能的描述很有意思:"语义编辑指的是在保持原始视觉语义的同时修改图像内容"。通俗点说,就是改了很多像素,但看起来还是那个味道。

我试着让它把一个正面人物形象转换成侧面视角,结果还挺不错的。官方案例中展示的Qwen吉祥物——水豚的多角度转换更让人印象深刻,不仅支持90度旋转,甚至可以做180度的完全转向,让你直接看到对象的背面。

特别是对于那些需要快速产出多种风格、多个角度素材的场景,这个功能能大大提高效率。

阿里甚至用这个功能为自家吉祥物制作了一套完整的MBTI表情包系列,这种IP延展的思路很值得借鉴。

3. 外观级局部修饰

这个功能最实用。官方的描述是"外观编辑强调保持图像的某些区域完全不变,同时添加、删除或修改特定元素"。去个水印、删个路人、调个颜色,这些日常需求它都能处理。

让我印象最深的是官方展示的一个案例:在场景中添加一个路牌,模型不仅成功插入了路牌,还生成了相应的倒影,这种对细节的关注确实让人刮目相看。

我特别测试了一下去除图片中的杂物功能,效果比我想象的要好。

当然,对于特别复杂的场景,还是需要专业工具,但应付日常需求绰绰有余。

实测分享

说一千道一万,不如实际测试一下。我用Qwen-Image-Edit优化了我的LOGO,提示词是:「优化LOGO,风格简洁现代,突出科技与未来感,体现人工智能和信息连接主题。采用冷色调(蓝色、银色),可加入电路、数据流、光效等抽象科技元素,整体专业且辨识度高。」

优化后的效果还不错,虽然不能说惊艳,但确实更有科技感了。

看到官方的案例生成了一个表情包,我也尝试了一下,还记得之前测试美图的RoboNeo变身表情包达人,有一套提示词,我直接拿来测试一下:

emoji表情:帮我生成一套表情包,学习苹果iOS 系统表情符号风格, 将照片中的人生成为此风格的3D贴纸头像。模仿形体,脸型,肤色、五官表情。 图中人物面部装饰,发型以及发饰,服装,配饰、表情、姿势保持一致。 背景白底,只要完整人物,确保最终图像看起来像官方的iOS表情符号贴纸。

接着再把生成出来的贴纸表情图,让他生成一张9宫格表情包

你还别说,这效果还真挺不意思的,使用面部表情生动丰富,加上文字就是表情包了。

最后改成中文,加上对话气泡的效果,看成品吧!

最重要的是,整理生成过程只用了不到一分钟,如果找设计师,最起码沟通就得半天。

体验建议

目前Qwen-Image-Edit提供两种使用方式:

在线体验(推荐新手):直接在Qwen Chat或Hugging Face上试用,界面友好,上手简单。

API调用(适合批量使用):$0.045一张,免费额度100张。对于我们这种经常需要处理图片的工作场景,这个价格还是很良心的。

结语

体验下来,我的感受是:Qwen-Image-Edit确实是个不错的图像编辑工具。官方提到"在多个公共基准上的评估表明,Qwen-Image-Edit在图像编辑任务中达到了最先进的(SOTA)性能",虽然我们普通用户感受不到这些技术指标,但实际使用体验确实不错。

它不会完全替代Photoshop或专业设计师,但对于我们这些非专业用户的日常需求,已经足够好用了。一些小的应用场景是完全适用的,比如产品图优化,加字,改字等等

作为产品经理,我觉得Qwen-Image-Edit最大的价值不在于技术有多么领先,而在于它降低了AI图像编辑的使用门槛。

如果你也经常有图像编辑需求,不妨去试试这个小工具。

在线体验: https://chat.qwen.ai/?inputFeature=image_edit

魔搭社区:https://modelscope.cn/models/Qwen/Qwen-Image-Edit

Hugging Face: https://huggingface.co/Qwen/Qwen-Image-Edit

声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
未经允许不得转载:阿里发布AI 图像编辑模型Qwen‑Image‑Edit,真的够用吗?
#Qwen-Image-Edit #AI图像编辑 #AI模型 #阿里 
收藏 1
DeepSeek-V3.1正式发布,并同步开源!
Grok悄悄上线的 Imagine到底是什么?一句话即可生成图片流,超速转15秒的视频
推荐阅读
  • Uizard:Autodesigner 2.0 AI生成式辅助UI设计工具,产品经理+UI设计
  • Cursor已死?Claude Code 的 L4 Agent 已来!Anthropic正在用大模型降维打击AI编程
  • Cursor推出Ultra 计划!Cursor Pro 不限请求次数了!
  • 薅羊毛!手把手教你免费获取15个月Google Gemini AI Pro学生套餐
  • OpenAI新上线的「学习模式」,ChatGPT秒变AI老师了
评论 (0)
请登录后发表评论
分类精选
Cursor 限制国内使用 Claude 等模型解决方案!
15241 1月前
DeepSeek宣布:降价,最高降价75%!别错过这个优惠时段,赶紧充值
13897 5月前
学生/非学生:如何申请Cursor Pro免费会员,如何通过SheerID验证快速激活全攻略
13527 3月前
字节跳动发布"扣子空间":AI协同办公的通用Agent平台开启效率革命
11341 4月前
即梦AI图片2.1:一句话快速生成带中文的海报图,免费AI文生图、视频工具、AIGC创作工具
10794 8月前
刚刚!Cursor风控又加强了,可能是因为这个原因!
9438 4月前
Trae国内版,搭载 doubao-1.5-pro、DeepSeek R1/V3模型,对比 Trae 国际版有什么不同
8345 5月前
Cline:自动化编程的VSCode插件Claude Dev + Gemini 2.0,快速构建智能应用
7892 8月前
注意!Cursor单设备登录新规:一个账户最多可以3台设备登录,且限制单点登录
6786 4月前
字节全新AI编程 IDE:Trae!性能对标Cursor,标配Claude 3.5和GPT-4o,免费无限量
5589 7月前

文章目录

关注「苏米客」公众号

订阅推送更及时,手机查看更方便
分类排行
1 Grok悄悄上线的 Imagine到底是什么?一句话即可生成图片流,超速转15秒的视频
2 阿里发布AI 图像编辑模型Qwen‑Image‑Edit,真的够用吗?
3 DeepSeek-V3.1正式发布,并同步开源!
4 收到邀请码,我赶紧试了阿里这款会做生意的Accio Agent
5 Cherry Studio零门槛快速启动和切换 Qwen Code、Gemini CLI、Claude Code
6 Vercel V0 发布 Agentic AI,v0.dev 正式升级为 v0.app,本周免费开放体验!
7 智谱开源 GLM-4.5V:全新视觉推理模型,国产 AI 大模型又炸场了!
8 各大平台免费 AI 大模型 + API汇总
9 Cursor一发三连:免费 GPT-5、Cursor CLI、Cursor 1.4王炸发布!
10 GPT-5终于发布,到底有多强?速览关键升级点
©2015-2024 苏米客XMSUMI 版权所有 · WWW.XMSUMI.COM 闽ICP备14005900号-6
程序库 免费影视APP 花式玩客 免费字体下载 产品经理导航 Axure RP 10 免费Axure模板 Axure原型设计 Axure元件库下载 申请友联