10+年产品经理聊聊产品、测测产品,产品人交流学习成长平台,按 Ctrl+D 收藏我们
关于我 留言板 小程序 标签云

苏米客

  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
  • 登录
  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
当前位置: 首页 » AI最新动态

刚刚!阿里 Qwen3-TTS 发布,语音合成能力大幅提升!

1月前 AI最新动态 718 0

继发布Z-Image(造相)广受好评后,阿里又上好货了。

就在刚刚发布 Qwen3-TTS,版本号 2025-11-27,这次更新解决了语音合成的几个核心问题。

音色大幅扩展
49 种高品质音色,覆盖不同性别、年龄和角色设定。具体包括撒娇搞怪的茉兔、青梅竹马小野杏、女汉子十三、严厉的墨讲师、智慧老者沧明子、萝莉萌妹萌小姬等角色音色。

语言和方言能力提升
支持 10 种主流语言:中文、英文、德语、意大利语、葡萄牙语、西班牙语、日语、韩语、法语、俄语。在 MiniMax TTS multilingual test set 上,平均词错误率(WER)优于 MiniMax、ElevenLabs 及 GPT-4o-Audio-Preview。

方言支持包括普通话、闽南语、吴语、粤语、四川话、北京话、南京话、天津话和陕西话,能还原地方口音特色。有用户指出,闽南话使用者 5000 万,吴语 8000 万,这些群体此前缺乏高质量语音合成服务。

韵律和语速优化
相比上一版本,自适应调节语速和韵律的能力大幅提高,拟人化程度接近真人。

API 调用简单
通过 DashScope SDK 即可使用,支持多种音色和语言参数。代码示例显示,只需几行代码就能将文本转换为音频文件并下载保存

# 请安装 DashScope SDK 的最新版本

import os
import requests
import dashscope
text = "那我来给大家推荐一款T恤,这款呢真的是超级好看,这个颜色呢很显气质,而且呢也是搭配的绝佳单品,大家可以闭眼入,真的是非常好看,对身材的包容性也很好,不管啥身材的宝宝呢,穿上去都是很好看的。推荐宝宝们下单哦。"
# SpeechSynthesizer接口使用方法:dashscope.audio.qwen_tts.SpeechSynthesizer.call(...)
response = dashscope.MultiModalConversation.call(
    model="qwen3-tts-flash-2025-11-27",
    api_key=os.getenv("DASHSCOPE_API_KEY"),
    text=text,
    voice="Cherry",
    language_type="Chinese", # 建议与文本语种一致,以获得正确的发音和自然的语调。
    stream=False
)
audio_url = response.output.audio.url
save_path = "downloaded_audio.wav"  # 自定义保存路径
try:
    response = requests.get(audio_url)
    response.raise_for_status()  # 检查请求是否成功
    with open(save_path, 'wb') as f:
        f.write(response.content)
    print(f"音频文件已保存至:{save_path}")
except Exception as e:
    print(f"下载失败:{str(e)}")

目前可以通过 Qwen Chat 的"朗读"功能体验,也有实时 API 和离线 API 可用。

HuggingFace 和 ModelScope 都有 Demo 可以试玩。

体验方式:

  • Qwen Chat 朗读功能:http://chat.qwen.ai
  • 实时 API 文档:https://modelstudio.console.alibabacloud.com/?tab=doc#/doc/?type=model&url=2840914_2&modelId=qwen3-tts-flash-realtime-2025-11-27
  • 离线 API 文档:https://modelstudio.console.alibabacloud.com/?tab=doc#/doc/?type=model&url=2840914_2&modelId=qwen3-tts-flash-2025-11-27
  • HuggingFace Demo:http://hf.co/spaces/Qwen/Qwen3-TTS-Demo
  • ModelScope Demo:http://modelscope.cn/studios/Qwen/Qwen3-TTS-Demo
声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
未经允许不得转载:刚刚!阿里 Qwen3-TTS 发布,语音合成能力大幅提升!
#Qwen3-TTS #Qwen3 #语音合成 
收藏 1
ClipSketch AI:将视频瞬间转化为手绘故事,并自动撰写适配社交媒体的爆款文案
别让AI变成炫技:产品经理吃透这10个概念,才能做出能落地的智能
推荐阅读
  • 刚刚,DeepSeek V3.2 正式发布:强化 Agent 能力,融入思考推理,支持工具调用
  • DeepSeek R1深夜悄悄更新,到底是性能大爆发!还是自媒体人的狂欢?
  • 字节又出狠活:免费开源的 DreamOmni2,让图像编辑变成一句话的事
  • OpenAI Codex:云端 AI 编程助手的“返祖”
  • 海螺AI接入Sora/Veo/Nano Banana,堪称 AI视频生成界的 “Cursor”
评论 (0)
请登录后发表评论
分类精选
Cursor 限制国内使用 Claude 等模型解决方案!
23787 6月前
学生/非学生:如何申请Cursor Pro免费会员,如何通过SheerID验证快速激活全攻略
22554 8月前
即梦AI图片2.1:一句话快速生成带中文的海报图,免费AI文生图、视频工具、AIGC创作工具
15316 1年前
DeepSeek宣布:降价,最高降价75%!别错过这个优惠时段,赶紧充值
14761 10月前
注意!Cursor单设备登录新规:一个账户最多可以3台设备登录,且限制单点登录
13694 9月前
字节跳动发布"扣子空间":AI协同办公的通用Agent平台开启效率革命
13184 9月前
刚刚!Cursor风控又加强了,可能是因为这个原因!
12520 9月前
Trae国内版,搭载 doubao-1.5-pro、DeepSeek R1/V3模型,对比 Trae 国际版有什么不同
11370 10月前
Cline:自动化编程的VSCode插件Claude Dev + Gemini 2.0,快速构建智能应用
9970 1年前
Trae Pro 来了,终于可以告别排队了!这价格真香
8325 7月前

文章目录

关注「苏米客」公众号

订阅推送更及时,手机查看更方便
分类排行
1 Skill(技能)正在成为标配,用Coze在3分钟内创建可商业化的AI Skill
2 GLM-4.7-flash 限时免费开放,GLM Coding Plan 即将限售,老用户抓紧了~
3 亲测 PixVerse R1:通用级实时视频生成的技术突破,让想象力进入 AI 构建的虚拟空间。
4 Ollama 官宣支持 Anthropic API :本地模型也可以接入ClaudeCode写代码了
5 火山方舟上新 Coding Plan,一键接入国产最强开发天团:Doubao-Seed-Code、DeepSeek-V3.2、GLM-4.7、Kimi-K2
6 扣子2.0上线,四大Agent能力直接炸场,还有限时用户福利!
7 Claude Cowork 现已向所有 Pro 用户(及以上)开放,刚发布就被拆解!
8 Coze重磅更新!扣子编程正式支持 Skill:从工具调用到专业工作流,你的智能体技能商店
9 ChatGPT Go版上线+广告引入:免费、低价付费用户,优先体验
10 GoogleAntigravity 宣布原生支持 Agent Skills,正在变成通用标准:后的实践观察与迁移建议
©2015-2024 苏米客XMSUMI 版权所有 · WWW.XMSUMI.COM 闽ICP备14005900号-6
微信文章助手 程序库 免费影视APP 免费字体下载 Axure RP 10 免费Axure模板 Axure元件库下载 申请友联