#SoulX

SoulX-Transcriber 开源多人对话转录模型:端到端架构,性能登顶公开基准测试
语音转文字(ASR)技术在 AI 时代已广泛应用,从会议记录到播客字幕,从在线教育到社交媒体,几乎每一个与语音相关的场景都离不开转录技术的支持。然而,当场景从单人演讲转向多人对话时,传统转录系统面临诸多挑战:多人同时发言、语速飞快重叠、主…
SoulX-Podcast:支持多人对话的方言tts,支持语音克隆,可现实长篇播客,文末一键包
最近在体验新的AI语音生成工具时,发现了一个不错的tts方言包,支持多人对话的方言tts:SoulX-Podcast。 作为一名经常接触各类AI开源项目的产品经理,我注意到语音合成领域正在从单人独白向多人对话场景演进。 这个项目的特别之处在…