腾讯发布开源MoE大语言模型Hunyuan-large-AET-电子技术应用

腾讯发布开源MoE大语言模型Hunyuan-large

总参数398B为业内最大

日期： 2024-11-06

来源：快科技

关键词： 腾讯开源MoE Hunyuan-large 大语言模型

11月5日消息，腾讯今日宣布推出业界参数规模最大、效果最好的开源MoE 大语言模型 Hunyuan-Large。

Huanyuan-large模型的总参数量为389B、激活参数为52B、训练token数量为7T、最大上下文长度为256K、词表大小为12.8w。

在技术创新方面，Hunyuan-large通过高质量的合成数据来增强模型训练，弥补了自然数据的不足。

其中，该模型预训练支持处理高达256K的文本序列，大幅提升了长文本上下文的处理能力，能够更高效地完成长文本任务。

据了解，Hunyuan-large在CMMLU、MMLU、CEva1、MATH等多学科综合评测集上表现优异，在中英文自然语言处理、代码生成、数学运算等9大能力维度中全面领先，超越了Llama3.1和Mixtral等一流开源模型。

此外，腾讯还宣布将推出自研的长文评测集“企鹅卷轴（PenguinScrolls）”，以填补行业在真实长文评测集上的空白。

企鹅卷轴基于公开的金融、法律、学术论文等长文本构建，文本长度从1K到128K不等，覆盖深度阅读理解和长文推理任务。

Magazine.Subscription.jpg

版权声明：本站内容除特别声明的原创文章之外，转载内容只为传递更多信息，并不代表本网站赞同其观点。转载的所有的文章、图片、音/视频文件等资料的版权归版权所有权人所有。本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如涉及作品内容、版权和其它问题，请及时通过电子邮件或电话通知我们，以便迅速采取适当措施，避免给双方造成不必要的经济损失。联系电话：010-82306118；邮箱：aet@chinaaet.com。

腾讯发布开源MoE大语言模型Hunyuan-large

日期： 2024-11-06

来源：快科技

相关内容