腾讯混元于本日正式颁布发表,推出开源翻译模子的1.5版本。该版本共包罗两个模子:Tencent-HY-MT1.5-1.8B和Tencent-HY-MT1.5-7B。今朝,这两个模子已在腾讯混元官网颁布发表,并同步上架GitHub与Huggingface等支流开源社区,供开辟者间接下载与操纵。

新版模子的一大亮点是其普遍的说话撑持才能。它可以或许或许完成33个语种之间的互译,同时撑持5种大都民族说话或汉语方言。除常见的中文、英语、日语,它还笼盖了包含捷克语、马拉地语、爱沙尼亚语及冰岛语在内的一系列小语种。
Tencent-HY-MT1.5-1.8B专为挪动终端等花费级装备而设想。该模子颠末优化量化处置,可以或许或许在唯一1GB内存的终端装备上完成离线及时翻译与端侧间接安排。固然参数规模很小,但其翻译成果据称已超出了市场上大都贸易翻译接口。同时,该模子在效力方面表现凸起,在推理速率上比拟支流贸易翻译模子API更具上风。处置50个tokens的均匀耗时仅需0.18秒,明显快于其他模子约0.4秒的程度。官方也展现了其翻译成果与苹果iPhone自带离线翻译功效的对照。
Tencent-HY-MT1.5-7B版本则是在之前取得WMT25比赛30个语种翻译冠军的模子根本上的严重进级。该版本明显晋升了翻译精确率,并大幅削减了译文中呈现夹带正文或语种稠浊的环境,使实在用性获得了进一步加强。
腾讯官方表现,在现实操纵中,用户可以或许同时安排1.8B和7B两个差别尺寸的模子,以完成端侧与云侧的协同使命。这类战略可以或许或许有用晋升模子输入的成果分歧性和全体系统的不变性,为更高品质的翻译办事供给了新的能够性。




























