10+年产品经理聊聊产品、测测产品,产品人交流学习成长平台,按 Ctrl+D 收藏我们
关于我 留言板 小程序 标签云

苏米客

  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
  • 登录
  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
当前位置: 首页 » AI产品百科

Sonic:腾讯开源图片唱歌说话AI数字人,图生视频

10月前 AI产品百科 1066 0

Sonic是腾讯和浙江大学推出的音频驱动肖像动画框架,基于全局音频感知生成逼真的面部表情和动作。Sonic基于上下文增强音频学习和运动解耦控制器,分别提取音频片段内的长期时间音频知识和独立控制头部与表情运动,增强局部音频感知能力。Sonic用时间感知位置偏移融合机制,将局部音频感知扩展到全局,解决长视频生成中的抖动和突变问题。Sonic在视频质量、唇部同步精度、运动多样性和时间连贯性方面优于现有的最先进方法,显著提升肖像动画的自然性和连贯性,支持用户对动画的精细调整。

Sonic功能

  1. 逼真的唇部同步:精确地将音频与唇部动作对齐,确保说话内容与嘴型高度一致。
  2. 丰富的表情和头部动作:生成多样化且自然的面部表情和头部运动,让动画更具生动性和表现力。
  3. 长时间稳定生成:在处理长视频时,能保持稳定的输出,避免抖动和突变,确保整体连贯性。
  4. 用户可调节性:支持用户基于参数调整控制头部运动、表情强度和唇部同步效果,提供高度的可定制性。

官网链接:https://github.com/jixiaozhong/Sonic 

声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
未经允许不得转载:Sonic:腾讯开源图片唱歌说话AI数字人,图生视频
#Sonic #图生视频 #AI数字人 
收藏 1
EchoMimic:一张照片生成说话视频,阿里巴巴推出的一个开源数字人项目
Bocca:一款AI语音转文字应用,支持离线使用,多语言转录
推荐阅读
  • 职得AI简历:简历AI生成工具,AI一键生成简历,在线简历生成与优化
  • TapNow:AI视频创作平台,全球首个商业视觉AI集成多种先进的图像和视频生成模型
  • Vireel:AI营销视频工具,快速制作广告视频,AI 视频广告生成
  • BeArt:一款免费且无水印的的在线AI换脸网站,适用于照片、视频和GIF中实现精准换脸
  • Foca Upscaler:免费 AI 图像放大与增强工具,支持 JPG、PNG、WebP 等格式
评论 (0)
请登录后发表评论
分类精选
Picarta:可以查找图片拍摄地点的AI识图软件,使用AI搜索照片拍摄的精确位置
15936 1年前
GPTGirlfriend:AI虚拟女友聊天平台,不受限制的成人角色扮演,AI女友进行成熟的对话
15686 1年前
BeArt:一款免费且无水印的的在线AI换脸网站,适用于照片、视频和GIF中实现精准换脸
14027 1年前
灵光:蚂蚁集团推出的全模态AI助手App,30秒做应用、实时写图文
12975 4月前
Noiz AI:AI语音克隆工具,一款TTS和视频配音神器
12563 1年前
Unscreen:在线视频和GIF背景抠除工具,不用绿幕轻松完成视频抠像
12156 1年前
抖音即创AI: 一站式智能AI创作管理平台
10651 1年前
Reecho 睿声:免费AI语音克隆与超拟真语音合成平台,用户只需提供一小段声音样本,完成声音的克隆
10494 1年前
嘎嘎降AI:AIGCleaner论文降重工具网站,专门降低文章AI率、查重率的工具
10090 1年前
NiceVoice:又一款免费AI声音克隆,3步克隆你的声音
9844 7月前

文章目录

关注「苏米客」公众号

订阅推送更及时,手机查看更方便
分类排行
1 阿里「悟空」AI 工作平台实测:一人团队的 content creation 闭环
2 叽伴(Kizuna):从语言模拟到世界模拟,AI 互动的下一站是共同经历
3 OpeniLink Hub:微信 iLink Bot 管理平台,操控飞书文档、生成二维码、搜 Github、导航高德地图20+ App
4 Octrix:多模型协同新范式,4 亿 Token 打磨出的 AI 分工利器
5 飞书 CLI 全掌握:从安装到发消息,一文带你搞懂飞书 CLI 是什么?
6 Accio Work:阿里上线电商版龙虾!30分钟用 Shopify 开店自动化赚钱?
7 Chefpilot:AI智能厨房助手,按口味与食材推荐每日菜谱,步骤清晰、图文精美
8 Audio To Text Transcription:音频转文本插件,支持多种格式,快速生成即时转写
9 ScreenGeany AI:AI屏幕截图助手,快速获取屏幕上的任何信息
10 TubeNofy AI:一键将 YouTube 视频转为结构化笔记与要点摘要
©2015-2024 苏米客XMSUMI 版权所有 · WWW.XMSUMI.COM 闽ICP备14005900号-6
微信文章助手 程序库 免费影视APP 免费字体下载 Axure RP 10 免费Axure模板 Axure元件库下载 申请友联