10+年产品经理聊聊产品、测测产品,产品人交流学习成长平台,按 Ctrl+D 收藏我们
关于我 留言板 小程序 标签云

苏米客

  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
  • 登录
  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
当前位置: 首页 » AI最新动态

LiblibAI 重磅发布 Vidu Q2:视频多主体参考,更自然、更可控的生成体验

6月前 AI最新动态 1411 0

LiblibAI 重磅上线 Vidu Q2 !

Vidu Q2 让我明显感受到了一种新的“代差感”——它终于让 AI 视频生成,从“能跑”变成了“跑得准”。

Vidu Q2核心变化

Vidu Q2 是生数科技推出的多模态视频生成模型,相比上一代,它在四个方面做了明显升级:语义理解、情绪表达、运动幅度和专业运镜。

我第一次测试时用了一个广告脚本级的提示词:

“让图1的模特,拿着图2的绿色护肤品,对着镜头展示,背景是图3。”

以往模型经常“理解错重点”,要么模特消失,要么产品不在画面里。

但在 Q2 里,模特动作自然、光影一致,甚至连手指与瓶身的交互都对得上。

这一点在广告电商场景里非常关键——它不仅生成内容,更理解了商业画面的逻辑。

Vidu Q2升级点

对比我用过的其他模型,Vidu Q2 的几个特征比较有代表性:

维度 Vidu Q2 体验 对比说明
参考图数量 支持 1-7 张图像 比常规 1-2 张的控制更强,可实现多主体一致性
生成速度 5 秒 1080P 视频 ≈ 40 秒 属于目前国产中最快批次
生成方式 文生、图生、首尾帧、参考图 覆盖创意、广告、影视类多类型需求
一致性表现 主体、光影逻辑稳定 几乎无“跳帧”或角色漂移问题
提示词理解度 支持复杂镜头、表情控制 在情感与动作表现上有明显进步

其中最具突破性的,是它的 多图参考控制 功能。

平台支持多种模型对比生成:

选择Vidu Q2 - 多图参考:

测试多主体保持一致性的能力,基本已经可以覆盖广告、电商、短剧甚至动画制作的基础场景。

创作体验

在使用过程中我发现,Vidu Q2 的提示词解析逻辑更接近“导演式描述”。

比如:

运镜控制:

镜头1:全景人物背影慢慢向前走 镜头2:特写人物走路的脚步 镜头3:特写人物走路的手 镜头4:特写女人的眼睛

模型能准确理解“镜头切换”和“视角变化”的语义,这让镜头语言从过去的“自动动画”提升到“镜头叙事”。

表情控制:

“男子内心很痛苦,但极力掩饰不让外人看出来”

生成的视频确实能表现微妙的情绪张力,而不是过去那种“僵硬笑”或“机械哭”。

使用场景

从我几轮体验来看,Vidu Q2 比较适合以下场景:

  • 电商广告视频:快速生成高一致性产品展示短片。

  • 短剧片段制作:可控人物和背景逻辑,适合故事片段合成。

  • 动画/二次元内容:对风格化画面支持好,动作自然。

  • 创意提案或分镜预演:提示词驱动镜头逻辑,节省预览成本。

新用户免费礼包

免费生图,每日约可生图 100 张

免费生视频,超清高质视频 3次

永久云存储空间3GB,优质付费模型模板免费试用

体验入口: https://www.liblib.art/viphome?referralCode=8b8RSk9C

结语

过去一年,AI 视频工具给人的印象是“能做点酷的东西”;

但从 Vidu Q2 开始,我更明显地感受到它正朝着“系统化创作”走。

它不只是会生成,而是理解语义、执行镜头、保持一致性——这已经接近视频创作流程的底层逻辑。

对于像我这样经常测试 AI 产品的从业者来说,这类模型的意义不仅是“快”,而是“准”,它正在让 AI 视频从炫技阶段,进入真正可用的生产阶段。

声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
未经允许不得转载:LiblibAI 重磅发布 Vidu Q2:视频多主体参考,更自然、更可控的生成体验
#LiblibAI #Vidu Q2 #图生视频 
收藏 1
快手发布 AI 编程矩阵:AI编程工具 CodeFlicker、自研的大模型 KAT-Coder
MiniMax M2 上线:顶级代码与 Agent 能力,仅 Claude 价格的 8%
推荐阅读
  • Lovart 品牌设计新功能详解:字体生成、Brand Kit、Skill 复用与 PSD 导出完整工作流
  • Kimi K2 发布体验:万亿参数能否成为Claude 4 平替?代码、Agent、写作全能选手来了!
  • 腾讯开源混元图像模型 3.0(HunyuanImage 3.0),免费开放使用!
  • Claude Desktop 新增定时任务:本地版 Claude Code,正在把 OpenClaw 的活变得更简单
  • GPT-Image-2 灰度测试作品展示:多风格图像生成能力详解
评论 (0)
请登录后发表评论
分类精选
Cursor 限制国内使用 Claude 等模型解决方案!
28823 9月前
学生/非学生:如何申请Cursor Pro免费会员,如何通过SheerID验证快速激活全攻略
26324 11月前
即梦AI图片2.1:一句话快速生成带中文的海报图,免费AI文生图、视频工具、AIGC创作工具
17825 1年前
注意!Cursor单设备登录新规:一个账户最多可以3台设备登录,且限制单点登录
17806 1年前
DeepSeek宣布:降价,最高降价75%!别错过这个优惠时段,赶紧充值
15383 1年前
Trae国内版,搭载 doubao-1.5-pro、DeepSeek R1/V3模型,对比 Trae 国际版有什么不同
14346 1年前
刚刚!Cursor风控又加强了,可能是因为这个原因!
14018 1年前
字节跳动发布"扣子空间":AI协同办公的通用Agent平台开启效率革命
13779 1年前
字节推出Trae CLI :Claude Code 和 Gemini CLI的国产平替 ?手把手教你如何安装Trae Agent
13553 9月前
Cline:自动化编程的VSCode插件Claude Dev + Gemini 2.0,快速构建智能应用
11735 1年前

文章目录

关注「苏米客」公众号

订阅推送更及时,手机查看更方便
分类排行
1 HappyHorse 1.0 阿里最强 AI 视频模型:千问 App 首发灰测,1080P 长镜头叙事能力登顶
2 MiMo-V2.5-Pro 开源发布:MIT 协议 + 1M 上下文 + Token 效率超闭源旗舰 60%
3 Claude 桌面版支持第三方模型:Cowork 和 Code 模式全面开放
4 GPT-5.5 与 DeepSeek V4 同日发布:价格 8.5 倍差距背后的 AI 格局变化
5 小米 MiMo-V2.5 开源 + Orbit 百万亿 Token 计划:面向 AI Builder 的生态布局
6 阿里HappyHorse(快乐小马)首发体验:视频生成效果不输即梦,价格也要跟上?
7 DeepSeek V4 发布:两款模型怎么选,以及怎么接入 API?
8 GPT-image-2 生成图片怎么识别?C2PA 内容凭证详解
9 火山方舟 vs 阿里百炼 Coding Plan 全模型实测对比,实际使用体验有多大差距?
10 GPT-5.5正式发布:全面超越 Claude Opus 4.7,重新夺回 SOTA 宝座
©2015-2024 苏米客XMSUMI 版权所有 · WWW.XMSUMI.COM 闽ICP备14005900号-6
微信文章助手 程序库 免费影视APP 免费字体下载 Axure RP 10 免费Axure模板 Axure元件库下载 申请友联