10+年产品经理聊聊产品、测测产品,产品人交流学习成长平台,按 Ctrl+D 收藏我们
关于我 留言板 小程序 标签云

苏米客

  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
  • 登录
  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
当前位置: 首页 » AI产品百科

MirageLSD:AI视频革命,40毫秒延迟,这真的是“直播界的Sora”吗?

4小时前 AI产品百科 55 0

相较于 Open AI 的 Agent 发布,我觉得昨晚最重要的发布的这个才是真的爆!

堪称AI视频领域的“核武器”:Decart发布MirageLSD:AI,实时直播40毫秒延迟,这下直播业和游戏业或遭降维打击!

这是一家叫 Decart 的小公司直接开挂般地发布了一个我觉得可能是“未来视频形态”的产品 —— MirageLSD:世界上首个实时直播视频模型,可以将摄像头的画面实时转换为其他风格和内容的视频。

这个产品能够让“AI视频生成”从炫技变成可以落地的体验。而且,它完全不是Sora那种“几秒钟视频+几分钟等候”的逻辑,它是实时生成、无限流畅、还能互动。

MirageLSD 到底做了什么?

简单说,它就是把摄像头画面,通过AI模型实时转化成另一个风格的世界,比如:

  • 40毫秒延迟响应:基本上就是"实时"的概念,比眨眼还快

  • 无限长度生成:不再受限于几秒钟的短片,可以持续进行

  • 24FPS流畅画面:看起来就像真实的视频流

  • 手势交互控制:用手遮住脸会自动变化特征,转动手中的笔会改变颜色和形状

我看到他们创始人在发布会上亲自演示,嘴里说着“狂野西部、宇宙、金色、罗马帝国”,画面直接就变成一场沉浸式的实时电影。而整个过程的延迟只有 40ms,基本和肉眼感知是同步的。

关键是:不限时长!24帧流畅直播! 这是目前其他AI视频生成模型根本做不到的事情,比如Runway、Pika Labs,虽然效果很棒,但都有一个致命问题:你需要等待。输入一个提示词,等个十几秒,然后得到一个几秒钟的视频片段,而且质量还不稳定。

两大核心突破

作为产品经理,我总是好奇这种"不可能"的产品是怎么实现的。Decart团队解决了两个关键问题:

第一个问题:错误累积 传统的AI视频生成就像接力赛,每一帧都基于前一帧生成。问题是,每一帧都会带来微小的错误,这些错误会像滚雪球一样越来越大,几秒钟后画面就会完全崩坏。这就是为什么之前的AI视频都很短。

Decart的解决方案是:历史增强(history augmentation):他们在训练时故意向历史帧中加入干扰,让AI学会预判和纠正自己可能犯的错误。这就像教一个人在走路时预判可能的绊脚石,从而避免摔倒。

第二个问题:计算速度 要实现40毫秒以内的响应,需要极致的性能优化。

为了将每帧的处理时间压缩到40毫秒以内,Decart采用了三管齐下的“暴力”优化策略:

  • 定制CUDA超级内核 (Mega Kernels):编写底层代码,为NVIDIA Hopper架构GPU量身定制执行方式,最大限度减少延迟。

  • 架构感知剪枝 (Architecture-aware Pruning):精简模型,剔除冗余参数,让模型更轻、更快,同时完美适配GPU硬件。

  • 快捷蒸馏 (Shortcut Distillation):训练一个小模型去模仿大模型的去噪轨迹,用更少的计算步骤实现同样高质量的输出。

这些技术细节听起来很枯燥,但效果是惊人的:比之前的模型快了16倍。

MirageLSD 是特效滤镜?

这不只是一个滤镜,刚开始我以为这只是一个高级的美颜滤镜,但深入了解后发现,这个产品的想象空间太大了。

对于内容创作者:想象一下,一个健身博主可以瞬间把自己的训练视频背景变成古罗马竞技场;一个游戏主播可以把《GTA》的画面实时转换成赛博朋克风格;一个网课老师可以让枯燥的会议室变成火星基地。

对于企业应用:视频会议可以有更丰富的虚拟背景;产品演示可以实时生成各种使用场景;培训课程可以让学员身临其境。

对于游戏开发:这可能是最让我兴奋的应用场景。传统游戏开发需要大量的建模、贴图、光影处理,但有了MirageLSD,开发者可以用文字描述直接生成游戏场景,实时渲染开放世界。

这款产品绝不只是做直播美化这么简单。Decart其实在构建一个类似“AI视频引擎”的平台能力开放后你可以做:

  • 直播:健身房直播直接变成古罗马角斗场

  • 视频会议:Zoom开会变成在太空舱里头脑风暴

  • 游戏直播:《GTA》画面秒切《赛博朋克2077》风格

  • 短视频创意:三十分钟从“手指变光剑”到“低成本大片”

  • 游戏开发:直接用文字Prompt创建游戏世界场景,无需建模

简单说:它不只是“生成内容”,而是实时接管视觉世界的入口,就像当年智能手机变成“计算平台”,Mirage也可能是“视频世界的iOS”。

写在最后

回顾这几年AI视频生成的演进,从Runway、Pika到Sora,我们看到了一个趋势:从“几秒短片”到“高质量内容”,但都还停留在“后期处理”阶段。

Decart的 MirageLSD 是我第一次看到的,真正能够做到 实时、可控、无限流畅、极低门槛的产品。

它让直播不再是“你看到我”,而是“我想象你看到的我”;让创意视频不再是后期慢慢剪,而是边演边变。

也许未来的“OBS”会变成“AI世界编辑器”,而我们只需要一句Prompt,一个动作,就能开启一场沉浸式的直播或游戏秀。

下一个10亿用户的入口,也许就在这40毫秒里。

MirageLSD 体验:https://mirage.decart.ai/

MirageLSD 技术报告: https://about.decart.ai/publications/mirage

声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
未经允许不得转载:MirageLSD:AI视频革命,40毫秒延迟,这真的是“直播界的Sora”吗?
#MirageLSD #Decart #AI直播 
收藏 1
Kiro爆了,现已需要内测申请和排队了,实操案例带你抢先体验Kiro(附安装包下载)
Claude Code Rules:claude.md文件配置完全指南
推荐阅读
  • Convai: 让虚拟游戏角色更智能的对话AI人工智能平台
  • WUI.AI:ai视频剪辑工具,将长视频转成短视频的视频编辑工具
  • Aivira:智能AI接待员,专业提供电话接听与预约安排服务
  • Subtiled:免费在线字幕编辑器,支持AI自动字幕生成
  • Ebookmaker:ai电子书制作工具,一键生成个性化电子书和有声书
评论 (0)
请登录后发表评论
分类精选
Picarta:可以查找图片拍摄地点的AI识图软件,使用AI搜索照片拍摄的精确位置
7671 4月前
Noiz AI:AI语音克隆工具,一款TTS和视频配音神器
6930 4月前
Unscreen:在线视频和GIF背景抠除工具,不用绿幕轻松完成视频抠像
6678 11月前
Reecho 睿声:免费AI语音克隆与超拟真语音合成平台,用户只需提供一小段声音样本,完成声音的克隆
6370 9月前
抖音即创AI: 一站式智能AI创作管理平台
5866 7月前
嘎嘎降AI:AIGCleaner论文降重工具网站,专门降低文章AI率、查重率的工具
4889 4月前
拍我AI:PixVerse国内版,重新定义AI视频创作的全民神器
4641 1月前
Coze: 字节跳动推出的AI聊天机器人和智能体创建平台
3813 8月前
BibiGPT:音视频内容一键总结工具
3455 8月前
BeArt:一款免费且无水印的的在线AI换脸网站,适用于照片、视频和GIF中实现精准换脸
3327 6月前

文章目录

关注「苏米客」公众号

订阅推送更及时,手机查看更方便
分类排行
1 MirageLSD:AI视频革命,40毫秒延迟,这真的是“直播界的Sora”吗?
2 FairPact AI:AI智能合同分析平台,帮助您在签署合同前识别潜在风险条款
3 RAGFlow:快速搭建一个能读懂公司文档的智能助手,不止是Chat机器人
4 Genspark:一个AI搜索引擎的超级Agent野心,为什么 Genspark 敢这么贵?
5 Astrid:AI穿搭AI试衣工具,支持图片搜索、衣橱整合、风格定制等功能
6 GPT Island:可在任何网页上与 AI 聊天的Chrome扩展插件程序
7 绘想:AI视频创作平台,一张图即可搞定专业级大片
8 BUNDL:AI购物助手,让 AI 帮您在多家商店的通用浏览器购物车
9 Inworld TTS:AI语音、多语言文本转语音工具,提供多种声音和情感选择
10 灰豚数字人:AI数字人平台,覆盖全行业的AI数字人自动化直播
©2015-2024 苏米客XMSUMI 版权所有 · WWW.XMSUMI.COM 闽ICP备14005900号-6
程序库 免费影视APP 花式玩客 免费字体下载 产品经理导航 Axure RP 10 免费Axure模板 Axure原型设计 Axure元件库下载 申请友联