Tencent-HY-MT1.5 – 腾讯混元开源的翻译模型

AI框架 2025-12-30

Tencent-HY-MT1.5是什么

Tencent-HY-MT1.5 是腾讯混元开源的翻译模型,包含两个版本Tencent-HY-MT1.5-1.8B 和 Tencent-HY-MT1.5-7B。模型支持33种国际语言互译及5种民汉/方言翻译,覆盖多种小语种。1.8B版本经过量化处理,仅需1GB内存即可在手机等消费级设备上实现端侧离线实时翻译,处理速度快。7B版本面向高性能场景,翻译准确率高,有效减少译文中夹带注释和语种混杂的情况。

Tencent-HY-MT1.5

Tencent-HY-MT1.5的主要功能

  • 多语言支持:涵盖 33 个语种的互译以及 5 种民汉/方言,除常见的中、英、日语等,还包括捷克语、马拉地语、爱沙尼亚语、冰岛语等小语种。
  • 端侧部署能力:HY-MT1.5-1.8B 经过量化处理,仅需 1GB 内存即可在手机等消费级设备上实现离线实时翻译,处理 50 个 tokens 的平均耗时仅 0.18 秒,远快于主流商用翻译 API 的 0.4 秒。
  • 翻译质量高:HY-MT1.5-1.8B 在 FLORES-200 等权威测试集中,效果达到 Gemini-3.0-Pro 等超大尺寸闭源模型的 90 分位水平,全面超越中等尺寸开源模型。
  • 实用性增强:支持术语库自定义、上下文长文本理解以及带格式文本翻译,用户可导入专业术语表,模型能基于前文语境优化后续翻译,并保留原始排版格式。

Tencent-HY-MT1.5的技术原理

  • On-Policy Distillation 策略:1.8B 模型采用了 On-Policy Distillation(大尺寸模型蒸馏)策略,由 7B 大模型作为教师实时引导训练,避免小模型死记硬背标准答案,通过纠正在预测序列分布时的偏移,让小模型从错误中学习,显著提升了小模型的泛化能力和翻译质量。
  • 术语库自定义:用户可针对不同行业与专业场景构建专属术语对照表,导入术语库后,模型在翻译过程中会优先采纳用户定义的标准术语,确保关键术语的准确性和一致性。
  • 上下文翻译:模型具备长文本与对话上下文理解能力,可基于前文语境持续优化后续翻译结果,适用于会议记录、访谈内容、小说章节、技术文档等长篇内容的翻译。
  • 带格式翻译:模型能保持翻译前后的格式信息不变,适用于网页、文档等结构化内容的翻译。

如何使用Tencent-HY-MT1.5

  • 获取模型:访问腾讯混元官网在线体验;可访问GitHub或 HuggingFace平台,下载所需的 Tencent-HY-MT1.5-1.8B 或 Tencent-HY-MT1.5-7B 模型部署使用。
  • 端侧部署:Tencent-HY-MT1.5-1.8B 经过量化,仅需 1GB 内存即可在手机等消费级设备上实现端侧直接部署和离线实时翻译。
  • 云侧部署:Tencent-HY-MT1.5-7B 适合高性能场景,可部署在云端,与 1.8B 模型协同使用,提升效果的一致性和稳定性。

Tencent-HY-MT1.5的项目地址

  • GitHub仓库:https://github.com/Tencent-Hunyuan/HY-MT)
  • HuggingFace模型库:https://huggingface.co/collections/tencent/hy-mt15

Tencent-HY-MT1.5的应用场景

  • 移动设备翻译:Tencent-HY-MT1.5-1.8B 经过量化处理,仅需 1GB 内存即可在手机等消费级设备上实现端侧离线实时翻译,适用于移动设备上的即时翻译需求,如旅行中的语言交流、即时通讯中的跨语言对话等。
  • 高性能翻译服务:Tencent-HY-MT1.5-7B 面向高性能场景,适合部署在云端,为需要高翻译质量的企业级应用提供服务,如跨国企业的文档翻译、专业领域的技术文档翻译等。
  • 多语言内容创作:支持 33 种国际语言互译及 5 种民汉/方言翻译,能满足内容创作者在多语言环境下的创作需求,如多语言视频字幕制作、跨语言文学创作等。
  • 专业术语翻译:支持术语库自定义,用户可导入专业术语表,模型在翻译过程中会优先采纳用户定义的标准术语,适用于专业领域的翻译需求,如医学、法律、科技等行业的翻译。
  • 长文本翻译:具备长文本与对话上下文理解能力,能基于前文语境持续优化后续翻译结果,适用于会议记录、访谈内容、小说章节、技术文档等长篇内容的翻译。
  • 格式化内容翻译:能保持翻译前后的格式信息不变,适用于网页、文档等结构化内容的翻译,确保翻译后的格式与原文一致。
©️版权声明:若无特殊声明,本站所有文章版权均归AI工具集原创和所有,未经许可,任何个人、媒体、网站、团体不得转载、抄袭或以其他方式复制发表本站内容,或在非我站所属的服务器上建立镜像。否则,我站将依法保留追究相关法律责任的权利。

相关文章