腾讯混元开源了翻译模型 Hy-MT2,提供自定义翻译风格和指令功能。经过实际测试,它在学术论文、法律合同、新闻报道等专业场景的翻译质量明显优于通用翻译工具,最小的 1.8B 版本压缩后仅 440MB,可在 iPhone 上离线运行。
核心能力:自定义翻译风格
Hy-MT2 主打的核心能力是自定义翻译风格和指令。你告诉它怎么翻,它能真正听懂,而不是翻完之后自己做主。在「腾讯 Hy 翻译」小程序中,左下角是翻译风格,右下角是个性化设定,两个功能覆盖了日常大多数翻译场景。

多种翻译风格实测
学术论文风格
测试一段关于不要熬夜的文字,对比默认风格和学术论文严谨风格,差别明显:

右侧学术论文结果在术语和逻辑两个层面更优:
- 术语:disrupt skin metabolism 的"代谢"换成"新陈代谢","功能"换成"机制",均为生物学和皮肤科学的规范表达;making the skin prone to acne 中"痤疮"换成皮肤科标准术语"粉刺"
- 逻辑:promote the formation of dark circles 译为"进而诱发",清晰体现因果递进关系
法律合同风格
同样一段文字,法律风格翻译的优势集中在三点:

- 权责边界:shall be limited to 的处理,"仅限于"换成"以……为限",约束力更强
- 指代清晰度:such assistance 译为此类协助,明确衔接前文,规避歧义
- 句式规范:无须、亦无须构成法律惯用的对仗句式
法律翻译的核心要求是精准、严谨、无歧义、符合行业惯例,Hy-MT2 的法律风格翻译在这几点上表现优秀。
新闻报道风格

新闻报道翻译在客观性、严谨性和信息完整度上,更符合专业媒体的表达规范。整体来看,Hy-MT2 不是简单地把词语换得更正式,而是在理解每一种文体本身的语气和逻辑之后,重新组织语言。
个性化设定
同一段话,设置社媒文风后,翻译结果自动加了"宝子们",还配上了符合语境的表情符号:

既提炼了核心信息,又避免了专业术语的晦涩感,同时用感叹号和表情强化情绪感染力,适配社媒用户的阅读习惯。
还可以自定义风格,比如"用小朋友能听懂的语言翻译,简单有趣":

这些细节说明:以前翻译工具的上限是翻得对,Hy-MT2 想做的事情是翻得合适。这两件事差了一个维度。
专有名词固定翻译
翻译工具容易踩坑的毛病是对专有名词的翻译。Hy-MT2 的个性化设定指令功能,可以提前告诉它某个词翻译成指定的版本,不要自己发挥:

设完之后,再翻包含这几个字的内容,它就老老实实用设定的版本,不再乱来。这个功能对有固定术语需求的人来说非常实用。

另外,如果翻译完发现某个词翻错了,可以直接点翻译结果旁边的修改按钮,改成想要的版本,然后存进记忆库,下次遇到同样的词直接调用:

这种越用越懂你的逻辑,比每次从头开始描述需求要省事得多。
三个版本,用途各不同
Hy-MT2 一共出了三个尺寸:
- 1.8B:最小版本,经过 1.25-bit 极限压缩后只占 440MB,iPhone 就能跑,支持离线使用,速度比上一代快 1.5 倍
- 7B:中间版本,速度和效果之间取平衡,适合大多数日常使用场景
- 30B-A3B:旗舰版,使用混合专家架构,遇到不同类型的翻译任务调用不同专家处理,专业领域表现突出

基准测试成绩
在 FLORES-200 测试集上(覆盖全球多语言的标准测试),Hy-MT2 三个版本分别达到了 Gemini 3.1 Pro 的 88%、97% 和 98% 的水平。7B 和 30B-A3B 的得分已超过 DeepSeek-V4-Pro 和 Kimi K2.6 等开源模型。

在涵盖金融、法律、医疗、政治、教育、科技等 8 个专业领域的测试里,三个版本的得分分别达到 Gemini 3.1 Pro 的 96%、98% 和 99%,几乎是持平。30B-A3B 版本在金融、政治、教育方向上,已经部分超过了主流翻译模型。

指令遵循是这次最核心的升级。官方自建了 IFMTBench 测试集,专门测模型能不能听懂指令。Hy-MT2-7B 和 30B-A3B 在这个测试上超越了同等规模的开源模型,非常接近 Gemini 3.1 Pro。

离线翻译与民族语言支持
Hy-MT2 的 1.8B 版本可以直接下载到本机,断网照样跑。440MB 的体积,现在随便一首 4K 视频都比这大。对于经常出差、坐地铁、去信号不好的地方的人来说,这个功能比任何测试数据都实在。
此外,Hy-MT2 还支持藏语、蒙语等多种民族语翻译,这项能力在市场上比较少见。
总结
腾讯混元这次在翻译方向发力,切入点是听懂你想要什么,而不是单纯地堆参数比分数。翻译这件事,从来都不只是把一个词换成另一种语言,而是在另一种语言里找到同样的语气、同样的分量、同样的场合感。Hy-MT2 离这件事,已经近了很多。
Hy-MT2 已全面升级为 Apache 2.0 协议开源,研究、商业、微调、二次开发全都没有附加条件。
体验方式
- 微信搜索「腾讯 Hy 翻译」小程序,直接进入使用
- HuggingFace:tencent/Hy-MT2
- GitHub:Tencent/Hy-MT2