中国联通发布元景思维链大模型
央企首个开源的通用思维链大模型
2025-01-24
来源:快科技
1月24日消息,今日,中国联通宣布,联通数据智能有限公司日前发布元景思维链大模型。
目前,元景思维链模型已在GitHub、魔搭、始智等社区全面开源。
作为央企首个开源的通用思维链大模型,元景思维链大模型既拥有强大慢思考能力,又具备不限于数学的多学科、多场景通用推理能力,且能做到针对不同任务和难度的自适应慢思考,大幅降低资源消耗。
中国联通表示,主流榜单的测评结果显示,元景思维链大模型的表现超过了目前最好的通用语言模型(OpenAI GPT-4o和Deepseek V3)以及开源思维链模型通义千问QwQ。
据介绍,元景思维链大模型通过任务自适应和难度自适应两种策略来实现模型的“自适应慢思考”。
在非推理任务测评集上对比,元景思维链模型在保证正确率的情况下明显倾向于生成更短的答案(长度小于100和200个token的数量明显多于通义千问QwQ):
该大模型在评估模型生成的长思维链数据时,除了考虑生成的答案正确与否,还综合考虑了问题的难度以及生成答案的长度,通过强化学习让模型将答案长度与当前问题的难度相匹配。
根据官方演示,元景思维链模型可顺利解答物理、化学高考真题、24点游戏、逻辑推理等问题。
本站内容除特别声明的原创文章之外,转载内容只为传递更多信息,并不代表本网站赞同其观点。转载的所有的文章、图片、音/视频文件等资料的版权归版权所有权人所有。本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如涉及作品内容、版权和其它问题,请及时通过电子邮件或电话通知我们,以便迅速采取适当措施,避免给双方造成不必要的经济损失。联系电话:010-82306118;邮箱:aet@chinaaet.com。