#ASR
SoulX-Transcriber 开源多人对话转录模型:端到端架构,性能登顶公开基准测试
语音转文字(ASR)技术在 AI 时代已广泛应用,从会议记录到播客字幕,从在线教育到社交媒体,几乎每一个与语音相关的场景都离不开转录技术的支持。然而,当场景从单人演讲转向多人对话时,传统转录系统面临诸多挑战:多人同时发言、语速飞快重叠、主…
Google语音技术探索:从语音识别到语音合成,ASR 与 TTS 模型的全面梳理
Google 在语音识别(ASR,Automatic Speech Recognition)和语音合成(TTS,Text-to-Speech)领域一直处于技术前沿,推出了多个先进的模型和工具。以下是对 Google 的 ASR 和 TTS …