AMD发布首个10亿开源AI模型OLMo-AET-电子技术应用

AMD发布首个10亿开源AI模型OLMo

用Instinct MI250 GPU集群训练而成

日期： 2024-11-08

来源：IT之家

关键词： AMD OLMo 开源AI模型 decoder-only

AMD 公司于 10 月 31 日发布博文，宣布推出首个完全开放的 10 亿参数语言模型系列 AMD OLMo，为开发者和研究人员提供强大的 AI 研究工具。

AMD OLMo 模型使用从零开始训练的 10 亿参数语言模型系列（LMs），在 AMD Instinct MI250 GPU 集群上训练，使用了超过 1.3 万亿个 tokens 进行预训练，让模型在处理自然语言任务时具有强大的推理能力。

OLMo 模型采用解码器（decoder-only）架构，并通过下一个标记预测（next-token prediction）进行训练，这种架构在生成文本和理解上下文方面表现出色。

与其他同类开源模型相比，AMD OLMo 在推理能力和聊天能力上表现优异。尤其是在多个基准测试中，其性能与最新的 OLMo 模型相当，且计算预算仅为其一半。

OLMo 除数据中心使用外，更支持配备 NPU（Neural Processing Unit，神经处理单元）的 AMD Ryzen AI PC 能够部署模型，使开发者能在个人设备提供 AI 功能。

AMD OLMo 是完全开源的，这意味着其他开发者和公司可以自由使用和修改这些模型，这让其成为希望探索 AI 技术替代方案的企业的一个可行选择。

官方订阅.jpg

版权声明：本站内容除特别声明的原创文章之外，转载内容只为传递更多信息，并不代表本网站赞同其观点。转载的所有的文章、图片、音/视频文件等资料的版权归版权所有权人所有。本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如涉及作品内容、版权和其它问题，请及时通过电子邮件或电话通知我们，以便迅速采取适当措施，避免给双方造成不必要的经济损失。联系电话：010-82306118；邮箱：aet@chinaaet.com。

AMD发布首个10亿开源AI模型OLMo

日期： 2024-11-08

来源：IT之家

相关内容