Arm更新Neoverse路线图,公布V1和N2平台
2021-05-04
来源:电子工程世界
随着更多云厂商越来越需要进行针对系统的专门优化,定制化的芯片设计开始变成普遍流行,基础设施芯片市场变得越来越有趣,玩家越来越多。今年以来,包括印度电子和信息技术部MeitY,法国芯片初创企业 SiPearl,韩国电子通信研究所 ETRI,都宣布开发基于Neoverse V1的产品。
国内厂商奋起直追
包括腾讯和阿里在内的一批国内系统厂商,正在加速构建基于Arm的服务器的芯片。
腾讯专项测试技术中心总监黄闻欣(Victor Huang)表示:“2020年,腾讯和Arm正式签署了一份合作协议,希望通过合作加速Arm Neoverse技术的测评和适配。后面我们通过TencentBench测试框架发现,得益于更多可扩展的CPU核心数,Arm服务器比传统的服务器性能表现更强劲。非常值得一提的是,其在AI推理和图片处理领域优势非常明显。”
阿里巴巴首席工程师周经森(Kingsum Chow)提到:“Arm的CPU资源的话,在我们现有的软件里会有两个考虑的点,一个是我们有些软件是需要重新编译的,另外一种不需要重新编译,只需要我们把Java applications在JVM(Java Virtual Machine)上跑好就可以了。在这方面,一年之前,我们就跟Arm的员工一起合作,把JVM的性能提高。过去一年里,我们从JDK8到JDK11,通过OpenJDK, 通过阿里巴巴 Dragonwell(OpenJDK的一个发行版),就把我们现有一些Java应用的一些性能提高了50%。”
Arm基础设施事业部高级副总裁兼总经理Chris Bergey表示:“腾讯在针对基于Arm硬件测试和软件支持方面持续投入,他们的硬件测试在性能方面展现了出色的结果,在每瓦性能方面也有非凡的表现。在软件的部份,他们既支持已编译和解译的代码库,也支持为这些代码库提供支撑的微服务框架。”
而针对阿里巴巴的合作,Bergey说道:“Java 对于阿里巴巴来说是一项至关重要的工作负载,他们的工程师已经编写了超过十亿行的 Java 代码。阿里巴巴和 Arm正在Java 的工作负载分析和调试方面持续合作。”
解密全新Neoverse路线图
正因为众多客户已经开始进行基于Neoverse产品的开发,Arm开始越来越快地公布其产品详细路线图。
日前,在Arm年度技术日上,Arm详细介绍了Arm Neoverse V1 和 Neoverse N2 平台。以及Arm Neoverse CMN-700 mesh 互连技术。
Neoverse路线图
CMN-700互联技术
Bergey表示,Arm CMN-700互联技术是构建V1和N2的关键要素。基于CMN-600而打造,从内核的数量和缓存的大小,到附加内存和IO设备的数量和类型都锁有所提升。支持DDR5和HBM。此外,增加了CXL功能,可为内存扩展和智能一致性加速。另外则是增加了诸多对于多芯片的支持功能,针对传统多插槽设计和新的芯片集或多芯片集成提高性能和优化功能。“多芯片集成将为突破传统的硅掩模版限制提供新的机遇,并为紧密耦合的异构计算提供更大的灵活性。”Bergey说道。
Neoverse V1:增加SVE功能
Bergey表示:“Neoverse V1 的设计理念是性能至上,因此我们加宽了微架构,并增加了缓冲区和队列的深度,以便在运行中容纳更多指令。”
与N1相比,Neoverse V1带来了 50% 的性能提升、1.8倍的矢量工作负载优化、以及4倍的机器学习工作负载优化,同时,Neoverse V1也是Arm强调性能优先的新型计算系列的第一个平台。Neoverse N1使芯片合作伙伴能灵活地为高度依赖CPU性能和带宽的应用构建计算能力,并为其提供 SoC 设计的灵活性。
秉持性能至上的思维,Neoverse V1 的设计理念创造了Arm迄今为止设计过的最宽微架构,以便容纳更多运行中的指令,支持高性能和百万兆级计算等市场应用。Neoverse V1宽而深的架构,加上 SVE功能将使其在单核性能和通过SVE延长代码存活期等方面占据领先优势,并为芯片设计人员提供可实现的灵活性。Bergey解释道:“Arm 现有的 SIMD 指令集 NEON 难以对某些代码进行矢量化处理,而 SVE 可以直接取用相同的代码,并很好地对其进行自动矢量化,相比于 NEON,可提速将近 3.5 倍。”
Neoverse N2:采用Arm V9架构
Neoverse N2平台是第一个基于Armv9架构的平台,在安全性、能耗以及性能方面都有全面的提升,正在为基础设施核心铺平道路。“N2 效率配置能够在单插槽线程上具有更大的竞争力,同时提供专属的内核,而非共享线程。”Bergey说道。
相比于N1,Neoverse N2在保持相同水平的功率和面积效率的基础上,单线程性能提升了40%。Neoverse N2 具备良好的可扩展性,可以横跨从高吞吐量计算到功率与尺寸受限的边缘和5G应用场景,并在这些应用中带来优于N1的表现,例如,在云端上提升 1.3 倍的NGINX,在 5G 和边缘应用上提升 1.2 倍的DPDK 数据包处理。
Neoverse N2平台提供了优异的单线程性能和业界领先且能为用户减少TCO的每瓦性能表现。Neoverse N2是第一个具备SVE2功能的平台,该功能可为云到边缘的性能效率带来巨大的提升。在诸如机器学习、数字信号处理、多媒体和5G等广泛应用场景中,SVE2除了带来大幅性能提升外,还带来了SVE 具备的编程简易性及可移植性等优势。
Bergey表示:“SVE2 将 SVE 相关的性能、编程简易性及可移植性等优势,应用到更广的领域和场景。SVE 意在加速 HPC,而 SVE2 则是将其扩展到 ML、DSP、多媒体和 5G 等应用场景。它融合了 NEON 丰富的数据操作、逻辑和算术指令集,以及 SVE 的自动矢量化和可扩展 性等功能。”
Neoverse与友商的性能对比
Bergey总结道:“V1 平台将成为 HPC 的一场变革,而N2将成为云端到边缘应用场景的最佳解决方案。”