语音模型 - 苏米客

最近在体验一批新发布的音频AI模型时，我注意到一个有趣的现象：云端语音服务越来越便宜，但对隐私敏感、网络受限或追求极低延迟的应用场景，本地离线方案的需求反而在上升。 Liquid AI最近发布的LFM2-Audio-1.5B引起了我的关注&…

349

1月前

AI开源项目

在这个大模型满天飞的时代，我们似乎已经习惯了和 AI 文字聊天时的“秒回”与“博学”。但一旦切换到语音通话模式，那种“丝滑感”往往瞬间消失——要…

484

1月前

AI最新动态

Kyutai TTS 是一款针对实时应用优化的文本转语音模型。它提供超低延迟、高准确率的语音合成，并支持文本流式输入和长音频生成，适用于各种需要实时语音交互的场景，例如语音助手、实时字幕生成等。Kyutai TTS 的独特之处在于其延迟流…

1000

6月前

AI产品百科

#语音模型