翻译 - 苏米客

Google 发布了实时语音翻译模型 Gemini 3.5 Live Translate，能在 70 多种语言之间做到边听边译，同时保留说话人的语调、节奏和音高。该模型基于 Gemini 3.5 架构，兼顾了 Gemini 3.0 Pro …

304

1周前

pyVideoTrans 是一款功能强大的开源视频翻译工具，由开发者 jianchang512 维护。它在 GitHub 上已获得 17.6K Star，核心目标是将视频从一种语言无缝转换为包含另一种语言配音和字幕的视频，集成了语音识别、…

384

3周前

AI开源项目

腾讯混元开源了翻译模型 Hy-MT2，提供自定义翻译风格和指令功能。经过实际测试，它在学术论文、法律合同、新闻报道等专业场景的翻译质量明显优于通用翻译工具，最小的 1.8B 版本压缩后仅 440MB，可在 iPhone 上离线运行。核心能…

322

3周前

AI产品百科

Wispli 是一款语音转文本工具，专为需要快速处理文本的专业人士设计。它通过 AI 驱动的转录、语音命令和智能格式化功能，帮助您提高工作效率。您可以使用它进行多种场景，例如撰写邮件、编写文档和控制软件。 Wispli功能 99 种…

244

1月前

AI产品百科

Genve AI是一款AI视频翻译和配音工具，帮助用户将内容扩展到140多种语言。它通过AI配音和唇形同步，让用户能够吸引全球观众。该工具适用于YouTube、TikTok和社交媒体等平台，帮助用户实现全球化。 Genve AI功能 A…

303

3月前

AI产品百科

最近在浏览Google的AI开源项目时，发现了一个值得关注的动向：Google将其多年积累的翻译能力整合进了一个开源大模型，取名TranslateGemma。这不是通用模型顺带的翻译功能，而是从架构设计到训练目标都围绕翻译任务专门优化的模…

1223

5月前

AI开源项目

作为一名经常体验各类 AI 产品的产品经理，我发现许多开发者在集成翻译功能时，往往面临三个核心困境：对商用翻译 API 的成本担忧、数据隐私合规的压力，以及对翻译质量的不确定性。最近在 Hugging Face 上接触到腾讯发布的混元翻译…

1575

5月前

ImageTranslator这款AI在线免费图片翻译工具，能够帮助用户即时翻译图片中的文字。通过上传图片，选择源语言和目标语言，即可快速获得翻译后的版本，并保持原始布局。适用于多种场景，如旅行、学习和工作。 ImageTranslato…

764

6月前

AI产品百科

PDF Translator是一款免费的在线PDF翻译工具，能够借助AI技术快速翻译PDF文档。用户只需上传文档，选择语言，即可获得格式保持一致的翻译文件，适用于各种场景。 PDF Translator功能 AI 智能翻译：利用先进AI…

1089

6月前

AI产品百科

作为产品经理，我经常被问到一个具体问题：有没有一款工具，能在不破坏原有排版的前提下，把图片或整份文档高质量翻译成中文？过去我试过不少产品，翻译本身问题不大，但一到复杂版式、图文混排、表格和脚注就容易散架。最近的实测里，通义的「翻译智能体…

1736

7月前

AI产品百科

#翻译