10+年产品经理专注分享AI 工具、AI 资讯、AI Coding、Vibe Coding与下一代产品创新,按 Ctrl+D 收藏我们
关于我 留言板 小程序 标签云

苏米客

  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
  • 登录
  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
当前位置: 首页 » AI开源项目

OmniVoice Studio:本地运行的开源 AI 声音克隆和视频配音工具

1月前 AI开源项目 1234 0

OmniVoice Studio:本地运行的开源 AI 声音克隆工具

OmniVoice Studio 是一个开源的 ElevenLabs 替代方案,支持实时听写、零样本语音克隆、视频配音,并且可以在桌面端本地运行。

对经常做视频、播客、课程、公众号素材整理的人来说,最有价值的地方在于:不用每次都把音频上传到云端,也不用被 API、账号和订阅额度卡住。

图片

核心功能

1. 语音克隆

给一小段语音,就可以克隆相似声音。项目强调支持 646 种语言,对多语种内容创作者很有吸引力。

图片

2. 视频配音

可以把视频或 YouTube 链接拿来处理:先转录 → 再翻译 → 再重新配音 → 最后导出视频。如果你经常把英文资料改成中文内容,或者做跨语言视频素材,这个流程会很实用。

图片

3. 实时听写

项目里有一个全局听写组件:⌘+⇧+Space 在任意应用里呼出,语音转文字后自动粘贴。这个功能很适合写作、做会议纪要、整理灵感,也适合不想一直打字的人。

4. 多 TTS 引擎

支持多种语音引擎切换,比如 OmniVoice、CosyVoice 3、MLX-Audio 等。可以根据设备、语言、声音效果去选择更合适的后端。

图片

适用场景

最适合以下几类场景:

  • 把英文视频资料转成中文配音
  • 给课程、教程、产品介绍做旁白
  • 给短视频批量生成不同语言版本
  • 把口述内容变成文章初稿
  • 做播客剪辑、配音和声音设计
  • 在本地保存自己的声音素材库

苏米注:做内容的人经常遇到一个问题——资料很多,但整理、翻译、配音、剪辑都很耗时间。如果这些步骤能在本地跑起来,就可以形成一条更稳定的内容生产链路。

安装和使用

项目支持桌面端:macOS、Windows、Linux。桌面安装包会在首次启动时自动配置环境和下载模型。

需要注意:项目目前还处于 active beta,使用时要预期可能会遇到 bug。

  • 如果只是尝鲜,可以先用桌面安装包
  • 如果想长期折腾、改功能或参与贡献,可以从源码运行

GitHub 项目地址:https://github.com/debpalash/OmniVoice-Studio

苏米的总结

如果你正在做视频、课程、出海内容、多语种素材整理,OmniVoice Studio 值得先收藏。等它继续稳定下来,它可能会成为很多创作者电脑里的常用工具。

声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
未经允许不得转载:OmniVoice Studio:本地运行的开源 AI 声音克隆和视频配音工具
#OmniVoice Studio #声音克隆 #TTS 
收藏 1
微信读书官方 Skill 实测:把阅读数据变成可查询、可分析的个人知识库
火山引擎 Agent Plan 深度评测:Coding Plan 之外的全模态选择
推荐阅读
  • Headroom:AI Agent 上下文压缩工具,token 节省 60-95% 的开源方案
  • Claude Code 生成专业图表的 15 个 Skills:覆盖 7 种渲染引擎的完整指南
  • 用Skill-Creator把GitHub变成你的专属Skill商店,快速创建Skill教程
  • Skill Seekers|自动将文档转化为Claude技能的开源工具
  • Huobao Drama:一站式短剧生成开源平台,从剧本到成片的AI视频自动化生成平台
评论 (0)
请登录后发表评论
分类精选
WeKnora:终于等到了腾讯ima的开源知识库框架,用 API 轻松打造本地智能文档检索
10356 9月前
OpenSpec:比 Cursor Plan 更聪明?试试这款让 AI 编码更靠谱的规范驱动工具
9935 8月前
Antigravity-Manager:这个开源神器让你白嫖ClaudeOpus 4.5,Gemini 3!还能接Claude Code等任意平台
7937 6月前
CapCut API:一个剪映API开源项目,让AI自动剪辑视频
7475 6月前
awesome-openclaw-skills:700+ Skills 一条命令装配完成,如何让本地 AI Agent 真正落地可用
7031 4月前
AIRI:你的开源AI女友,让你随时拥有属于自己的 AI VTuber
6923 9月前
CompressO:开源免费的视频压缩神器,让你的硬盘瞬间轻松 10 倍
6813 9月前
就要创作:从提示词到创作团队,开源 AI 网文写作平台
6791 8月前
iFlow CLI:让命令行终端不止于编程的AI效率开源神器
6040 10月前
Composio:让AI Agent自动完成工作任务,能让AI一键操控你的所有软件
6021 8月前

文章目录

关注「苏米客」公众号

订阅推送更及时,手机查看更方便
分类排行
1 齐码.SKILL:6步 Vibe Coding 工作流,从想法到产品的标准化开源方案
2 SmartCall:开源 AI 呼叫中心系统,Java + 大模型 + Asterisk 全链路语音交互
3 MopMonk(扫地僧)Agent:全球 AI 安全战力榜杀出的中国黑马
4 4个开源 Skill 把 AI 写作腔调治没了
5 LangAlpha:开源金融 Agent,把投研从问答变成长任务工作流
6 开源douyin-video-extractor:一句话让AI帮你提取抖音视频和无水印素材
7 开源RedFox红狐数据:一个Key搞定抖音小红书公众号,10+平台API统一接入
8 开源slides-edit:画框改HTML课件,像改图一样简单
9 Google 开源 design.md:让 AI Agent 输出专业 UI 的设计规范
10 开源JitMind SDK:框架无关的思维导图编辑器,3分钟集成任意前端项目
©2015-2024 苏米客XMSUMI 版权所有 · WWW.XMSUMI.COM 闽ICP备14005900号-6
微信文章助手 程序库 免费影视APP 免费字体下载 产品经理导航 爱克硕儿 产品经理AI资讯 Axure元件库下载 申请友联