#翻译

Google Gemini 3.5 Live Translate:70+语言实时同声翻译模型发布
Google 发布了实时语音翻译模型 Gemini 3.5 Live Translate,能在 70 多种语言之间做到边听边译,同时保留说话人的语调、节奏和音高。该模型基于 Gemini 3.5 架构,兼顾了 Gemini 3.0 Pro …
pyVideoTrans 开源视频翻译工具:语音识别+翻译+配音+声音克隆一站式解决方案
pyVideoTrans 是一款功能强大的开源视频翻译工具,由开发者 jianchang512 维护。 它在 GitHub 上已获得 17.6K Star,核心目标是将视频从一种语言无缝转换为包含另一种语言配音和字幕的视频,集成了语音识别、…
腾讯混元 Hy-MT2 翻译模型:自定义风格翻译,比 Gemini 3.1 Pro 差多少?
腾讯混元开源了翻译模型 Hy-MT2,提供自定义翻译风格和指令功能。经过实际测试,它在学术论文、法律合同、新闻报道等专业场景的翻译质量明显优于通用翻译工具,最小的 1.8B 版本压缩后仅 440MB,可在 iPhone 上离线运行。 核心能…
Wispli:AI语音转写与实时翻译工具,内置英语口语辅导
Wispli 是一款语音转文本工具,专为需要快速处理文本的专业人士设计。 它通过 AI 驱动的转录、语音命令和智能格式化功能,帮助您提高工作效率。 您可以使用它进行多种场景,例如撰写邮件、编写文档和控制软件。 Wispli功能 99 种…
Genve AI:AI多语言视频翻译与配音工具,提供高保真配音与精准唇形同步
Genve AI是一款AI视频翻译和配音工具,帮助用户将内容扩展到140多种语言。它通过AI配音和唇形同步,让用户能够吸引全球观众。该工具适用于YouTube、TikTok和社交媒体等平台,帮助用户实现全球化。 Genve AI功能 A…
TranslateGemma:Google开源专业翻译模型,55语言覆盖+图文识别
最近在浏览Google的AI开源项目时,发现了一个值得关注的动向:Google将其多年积累的翻译能力整合进了一个开源大模型,取名TranslateGemma。 这不是通用模型顺带的翻译功能,而是从架构设计到训练目标都围绕翻译任务专门优化的模…
腾讯混元超强开源翻译模型 HY-MT1.5:本地部署的多语言翻译、方言,实时翻译
作为一名经常体验各类 AI 产品的产品经理,我发现许多开发者在集成翻译功能时,往往面临三个核心困境:对商用翻译 API 的成本担忧、数据隐私合规的压力,以及对翻译质量的不确定性。 最近在 Hugging Face 上接触到腾讯发布的混元翻译…
ImageTranslator:一键上传即译,保留版式,旅行/学习/工作都能用的免费AI图片翻译利器
ImageTranslator这款AI在线免费图片翻译工具,能够帮助用户即时翻译图片中的文字。通过上传图片,选择源语言和目标语言,即可快速获得翻译后的版本,并保持原始布局。适用于多种场景,如旅行、学习和工作。 ImageTranslato…
PDF Translator:免费的在线PDF翻译工具,快速、准确地将 PDF 文件翻译成多种语言
PDF Translator是一款免费的在线PDF翻译工具,能够借助AI技术快速翻译PDF文档。用户只需上传文档,选择语言,即可获得格式保持一致的翻译文件,适用于各种场景。 PDF Translator功能 AI 智能翻译:利用先进AI…
通义的翻译智能体:阿里的这款免费翻译智能体,翻译不丢版式
作为产品经理,我经常被问到一个具体问题:有没有一款工具,能在不破坏原有排版的前提下,把图片或整份文档高质量翻译成中文? 过去我试过不少产品,翻译本身问题不大,但一到复杂版式、图文混排、表格和脚注就容易散架。 最近的实测里,通义的「翻译智能体…