《电子技术应用》
您所在的位置:首页 > 人工智能 > 业界动态 > 阿里通义千问发布Qwen2-Math开源AI模型

阿里通义千问发布Qwen2-Math开源AI模型

通义千问家族新成员 数学能力超 GPT-4o
2024-08-09
来源:IT之家

8 月 9 日消息,阿里通义千问 Qwen2 开源家族迎来新成员 Qwen2-Math,共有 15 亿参数、70 亿参数和 720 亿参数三个版本,是基于 Qwen2 LLM 构建、专门用于数学解题的语言模型

简介

Qwen2-Math 是一系列基于 Qwen2 LLM 构建的专门用于数学解题的语言模型,其数学能力显著超越了开源模型,甚至超过了闭源模型(如 GPT-4o),官方希望为科学界解决需要复杂多步逻辑推理的高级数学问题做出贡献。

0.png

性能

团队在一系列数学基准评测上评估了我们的数学专用模型 Qwen2-Math。在 Math 上的评测结果表明,其最大的数学专用模型 Qwen2-Math-72B-Instruct 超越了最先进的模型,包括 GPT-4o、Claude-3.5-Sonnet、Gemini-1.5-Pro 和 Llama-3.1-405B。

0.png

0.png

Qwen2-Math 指令微调模型

正开发多语言模型

从报道中获悉,新模型系列 Qwen2-Math 专注于数学能力,目前仅支持英文,团队计划推出支持英文和中文的双语模型,并且开发多语言模型。


Magazine.Subscription.jpg

本站内容除特别声明的原创文章之外,转载内容只为传递更多信息,并不代表本网站赞同其观点。转载的所有的文章、图片、音/视频文件等资料的版权归版权所有权人所有。本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如涉及作品内容、版权和其它问题,请及时通过电子邮件或电话通知我们,以便迅速采取适当措施,避免给双方造成不必要的经济损失。联系电话:010-82306118;邮箱:aet@chinaaet.com。