重磅！谷歌推出全新TranslateGemma翻译模型系列-育师

1 月 16 日，Google 正式推出了全新开放翻译模型系列TranslateGemma。该系列基于 Gemma 3 架构开发，提供 4B、12B 和 27B 三种参数规模。Google 表示，TranslateGemma 的推出标志着开放翻译技术的又一重大进展，旨在打破语言障碍，使用户无论身处何地、使用何种设备，都能实现无障碍沟通。

据介绍，TranslateGemma 系列在保留大型模型先进能力的同时，将知识进行精炼，形成紧凑、高性能的开放模型版本，实现了效率与翻译质量的平衡，无需为了追求快速响应而降低性能。

性能超越其两倍体量的模型

技术评估结果显示，TranslateGemma 系列模型的超高运行效率成为本次测试中最引人注目的亮点。

经专项训练流程优化后，12B 参数版本的 TranslateGemma 在 WMT24++ 基准测试中，以 MetricX 为评估标准，最终表现超越了 27B 参数的 Gemma 3 基准模型。这一结果对于广大开发者而言无疑是重大利好 —— 仅需投入不到基准模型一半的参数量，就能获得高保真的翻译质量。

这种效率层面的突破，能够在不牺牲翻译准确性的前提下，同步实现更高的数据吞吐量与更低的运行延迟。值得一提的是，即便是参数规模仅为 4B 的轻量版本，其性能也可与更大体量的 12B 基准模型相媲美，凭借这一特性，该版本也成为移动端推理场景的理想选择。

据公开测试信息，TranslateGemma 的相关性能验证基于涵盖 55 种语言的 WMT24++ 数据集展开，该数据集覆盖多语系，同时兼容高、中、低资源语言类型。测试结果表明，与 Gemma 基准模型相比，TranslateGemma 不仅显著降低了全语言类型的翻译错误率，更实现了运行效率与翻译质量的双重突破。

Translation Direction 翻译方向	TranslateGemma 27B	CommandA-MT 111B
English-Italian 英语-意大利语	1.8	1.6
English-Korean 英语-韩语	3.1	4.5
English-Maharati 英语-马拉地语	3.1	11.6
Czech-Ukrainian 捷克语-乌克兰语	5.3	6.5
English-Chinese 英语-中文	6.3	8.3
English-Serbian 英语-塞尔维亚语	8.7	12.4

源自 Gemini 的知识蒸馏

这种“智能密度”是如何实现的？这主要得益于特定的两阶段微调方案，它将 Gemini 模型的“直觉”蒸馏到了开放架构中。

有监督微调（Supervised Fine-Tuning）：Go哦给了我在多样化的平行语料库上对 Gemma 3 基础模型进行了微调。该数据集由人工翻译文本与 Gemini 模型生成的优质合成译文共同构成；在实现广泛语言覆盖的同时，确保了低资源语言翻译依然具备卓越的保真度。
强化学习（Reinforcement Learning）：为了进一步提升翻译质量，Google 引入了创新的强化学习阶段。同时，其集成了 MetricX-QE 和 AutoMQM 等先进指标构建奖励模型，以此引导模型生成语境更准确、表达更自然的译文。

前所未有的语言覆盖范围

据了解，Google 团队针对 TranslateGemma 所支持的 55 种语言对，开展了严格的训练与全方位评估工作。这一系列举措，确保该模型不仅在西班牙语、法语、中文、印地语等主流语种的翻译场景中表现稳定可靠，在众多低资源语种的处理上，同样能够输出高质量的翻译性能。

与此同时，Google 还进一步突破技术边界，额外针对近 500 个新增语种启动了训练工作。虽然目前这部分扩展语种尚未完成完整的指标评估，但相关的语种完整清单已被纳入技术报告当中，Google 此举意在为业界提供参考，鼓励更多从业者共同参与到相关领域的探索与深化研究中。

卓越的多模态性能

TranslateGemma 完整继承了 Gemma 3 强大的多模态能力。Google 在 Vistra 图像翻译基准测试测试中发现，即便在训练过程中未进行专门的多模态微调，纯文本翻译性能的提升也显著增强了模型对图中文字的翻译表现。

广泛的硬件兼容性

TranslateGemma 为开放翻译模型树立了新标杆，在实现顶尖性能的同时，兼顾了卓越的运行效率。该系列提供三种参数规模，旨在适配多种不同的部署环境：

4B 模型：针对移动端与边缘侧部署进行了深度优化
12B 模型：旨在消费级笔记本电脑上流畅运行，为本地开发环境提供研究级的强大性能。
27B 模型：专为极致精度而生，仅需单块 H100 GPU 或云端 TPU 即可运行。

如何开始使用 TranslateGemma

TranslateGemma 的发布为研究人员与开发者带来了强大且适配性极佳的工具，能够胜任多样化的翻译任务。Google 表示，“我们满怀期待，愿与广大开发者共同见证这一系列模型如何拓展应用边界、消除语言障碍，并进一步促进全球文化的交融”，获取方式如下：

选择适合你的规模：现在即可前往 Hugging Face 或 Kaggle 下载全系列模型权重。若追求低延迟与端侧运行效率，推荐选择 4B 或 12B 版本；若追求极致的翻译精度，27B 模型则是您的首选。
使用正确的提示词（Prompt）：Google 评估结果表明，提示词的设计对效果影响显著。为了获得基准测试中所呈现的优异性能，官方建议你将输入文本嵌入到训练时专用的翻译模板中，可以在快速入门 Colab 笔记本中尝试。
了解详情：若需深入了解训练数据、技术方法及评估结果，可阅读完整的技术报告。

技术报告：https://arxiv.org/pdf/2601.09012

HuggingFace 体验地址：https://huggingface.co/collections/google/translategemma