10+年产品经理聊聊产品、测测产品,产品人交流学习成长平台,按 Ctrl+D 收藏我们
关于我 留言板 小程序 标签云

苏米客

  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
  • 登录
  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
当前位置: 首页 » AI产品百科

Phenaki: Google开发的文本生成视频AI模型

1年前 AI产品百科 1200 0

Phenaki是Google研究团队开发的一款能够从文本生成视频的AI模型,它可以根据用户输入的一系列文本提示,合成出逼真的视频画面。

这项技术在视频生成领域具有创新性和领先性,因为它能够应对多种挑战,例如高计算成本、可变视频长度、高质量文本视频数据的缺乏等。

Phenaki的主要组成部分有两个:一个是编码器-解码器模型,它可以将视频压缩为离散的嵌入或令牌,同时能够处理不同长度的视频;

另一个是变换器模型,它可以将文本嵌入转换为视频令牌,然后再解码为实际的视频。

Phenaki还利用了大量的图像-文本对数据和少量的视频-文本对数据进行联合训练,从而实现了对视频数据集之外的内容的泛化。

Phenaki目前已经能够根据开放域的时间可变文本或故事生成任意长度的视频,并且在空间-时间质量和每个视频的令牌数量上都优于目前文献中使用的逐帧基线。

特色功能

  • 从时间可变文本生成视频:Phenaki可以根据用户输入的一系列文本提示,按照时间顺序生成对应的视频画面。这些文本提示可以是任意主题、风格和情节的,只要它们能够描述出清晰和连贯的场景。
  • 生成逼真和多样化的视频:Phenaki可以生成高分辨率、高帧率、高动态范围和高色彩准确度的视频,同时保持画面的清晰度、稳定性和连续性。Phenaki还可以生成多样化和富有创意的视频,例如将现实中不存在或难以实现的场景呈现出来,或者将不同风格和元素进行混合和变换。
  • 支持交互式和迭代式生成:Phenaki支持用户与模型进行交互式和迭代式生成,即用户可以在任何时候修改、添加或删除文本提示,然后观察模型如何调整视频输出。这样用户就可以根据自己的喜好和需求进行创作和编辑,实现更高程度的个性化和定制化。

产品价格

目前,Phenaki还没有正式发布为商业产品,因此还没有公布具体的价格信息。不过,根据Google研究团队在其网站上发布的信息,Phenaki目前已经开放了部分示例视频供用户在线观看,并且计划在未来提供更多的视频样本和交互式演示。

此外,Google研究团队还表示,他们正在探索将Phenaki应用于不同的领域和场景,例如教育、娱乐、广告、游戏等,以及与其他的视频处理技术进行结合,例如超分辨率、风格迁移、视频编辑等。

官网地址:https://phenaki.video/

声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
未经允许不得转载:Phenaki: Google开发的文本生成视频AI模型
#Phenaki #文本生成视频 #AI视频 
收藏 1
Artflow.ai: 基于人工智能的AI虚拟人视频生成平台
HeadshotPro: 基于人工智能的AI专业头像生成器工具
推荐阅读
  • Appy Pie:AI无代码开发平台,提供包括App构建器、网站构建器、聊天机器人创建工具、工作流程自动化和AI设计工具
  • 神采PromeAI: 基于人工智能的AI设计助手
  • Memingo:AI表情包生成器,快速制作和分享有趣的表情包
  • Genspark AI Browser:AI浏览器,集成了多种智能代理、内置MCP应用商店、广告拦截等核心功能
  • SkillCast:我做了一个虾技市场,可以让你的龙虾在这里打卡、下技能、托管技能
评论 (0)
请登录后发表评论
分类精选
Picarta:可以查找图片拍摄地点的AI识图软件,使用AI搜索照片拍摄的精确位置
16443 1年前
GPTGirlfriend:AI虚拟女友聊天平台,不受限制的成人角色扮演,AI女友进行成熟的对话
16356 1年前
BeArt:一款免费且无水印的的在线AI换脸网站,适用于照片、视频和GIF中实现精准换脸
14409 1年前
灵光:蚂蚁集团推出的全模态AI助手App,30秒做应用、实时写图文
13231 5月前
Noiz AI:AI语音克隆工具,一款TTS和视频配音神器
12852 1年前
Unscreen:在线视频和GIF背景抠除工具,不用绿幕轻松完成视频抠像
12441 1年前
NiceVoice:又一款免费AI声音克隆,3步克隆你的声音
12282 8月前
嘎嘎降AI:AIGCleaner论文降重工具网站,专门降低文章AI率、查重率的工具
11950 1年前
抖音即创AI: 一站式智能AI创作管理平台
10991 1年前
Reecho 睿声:免费AI语音克隆与超拟真语音合成平台,用户只需提供一小段声音样本,完成声音的克隆
10894 1年前

文章目录

关注「苏米客」公众号

订阅推送更及时,手机查看更方便
分类排行
1 Anthropic Project Deal 实验:当 Claude Agent 替你在二手市场砍价
2 ClawEmail 网易出品:为 OpenClaw 和 Hermes 配备专属 AI 工作邮箱
3 Qwen3.6-27B 实测报告:本地模型跑出 GPT-4 水准,27B Dense 架构超越 397B MoE
4 MonkeyCode :在线 AI 编程平台实测,手搓字体预览器和安卓提词器
5 AI操作系统三国杀:Hermes vs OpenClaw vs WorkBuddy 全方位对比评测
6 Hermes Agent vs WorkBuddy:AI 操作系统与办公助手的定位差异详解
7 华为云 OfficeClaw 深度实测:Harness Engineering 新范式下的多 Agent 办公助手
8 阿里 Meoo 上线:AI 零门槛开发网站,集成四大模型,一键部署阿里云
9 Seedance 2.0 真人短剧 Agent 实战:商汤 Seko 全能视频模式完整使用指南
10 waoowaoo:AI短剧/漫画视频创作工具,文本一键生成分镜、角色和场景
©2015-2024 苏米客XMSUMI 版权所有 · WWW.XMSUMI.COM 闽ICP备14005900号-6
微信文章助手 程序库 免费影视APP 免费字体下载 Axure RP 10 免费Axure模板 Axure元件库下载 申请友联