亚马逊云科技的Graviton3为什么只有64核,亚马逊云科技的回应来了!
2021-12-29
来源:趣味科技
本文为re:Invent 2021亮点解读的第一部分,关于自研Graviton的部分,后续还有关于机器学习和关于存储的部分,敬请关注后续。
正文:
自从亚马逊云科技(以下简称AWS)发布自研的ARM处理器以及ARM云主机以来,各家云服务商在自研芯片的道路上越走越远。
2021年,云服务商内卷的越来越激烈了,作为云服务商内卷运动的发起者,AWS在2021年年底又介绍了新一款ARM处理器——Amazon Graviton 3。
只不过,Graviton 3沿用了64核心的配置,而市场上已经有云服务商做出了128核的Arm芯片,背后究竟有什么样的考虑呢,本文将分享亚马逊云科技大中华区产品部计算与存储总监周舸的正式回应。
时隔2年,Graviton 3带来哪些提升
AWS官方新闻宣称,Graviton 3比Graviton 2快了25%,与科学计算和媒体编码有关的浮点运算性能翻了1倍,加密工作负载运算速度提升高达2倍,由于支持bfloat16,所以,机器学习推理运算能力提升了3倍。
目前,Graviton 3公开的信息比较少,凑巧在AWS首席布道师Jeff Bar的推特里发现了一张开盖的Graviton 3的图片。图中显示,Graviton 3采用的是时下最流行的Chiplet设计和先进的封装技术,这为I/O提升埋下了伏笔。
另外一张网传的图片显示Graviton 3采用了PCIe 5.0的I/O连接。DDR 5加PCIe 5.0,IO规格与最新的x86系列CPU对齐了。按理说,后者距离上市应该还有几个月时间,Graviton 3抢先一步了。
此外,AWS还宣称,Graviton 3的功耗最多可降低60%,不清楚是跟x86服务器做对比的还是跟此前的哪款服务器做对比,总之,AWS有资格获得一枚绿色节能小能手勋章。
在面向中国媒体的沟通会上,亚马逊云科技大中华区产品部总经理顾凡大谈亚马逊云通过技术创新(比如Graviton通用芯片和Trainium AI芯片),通过具体行动在节能减排上所取得的成绩(比如大量使用清洁可再生能源),让人们看到上云对于节能减排的意义,多买一台云服务器可能比多种一棵树还环保。
AWS副总裁Peter DeSantis解释了提升Graviton核心效能的一个重要因素,那就是让核心变得更宽(Make the core wider),比如,把Graviton3把每个核心在每个时钟周期执行的指令数量从5个提升到8个,总之,就是让每个时钟周期能做更多事儿。
AWS还宣布Graviton 3芯片将用于EC2 C7g实例,新的服务器将采用了新的DDR5内存,与此前Graviton 2采用的DDR 4内存相比,DDR 5的内存带宽提升50%,有利于提高科学计算等内存密集型应用的性能表现。
C7g实例所采用的服务器硬件采用了三路设计,Graviton2的服务器只有2路,计算密度得以大幅提升。笔者所见的单路双路和四路会多一些,三路相对少一些。
另外,网传图片显示Graviton 3使用了大约550亿个晶体管,而大会上,AWS副总裁Peter DeSantis展示的PPT则显示有500亿晶体管,这年头,上下50亿晶体管都是误差范围了?
官方数据显示,C7g实例与由Graviton2支持的C6g实例相比,计算密集型工作负载性能提高多达25%,C7g实例的网络带宽也高出20%。
此外,C7g实例还支持 Elastic Fabric Adapter (EFA),允许应用程序直接与网络接口卡通信,提供更低且更一致的延迟,提高需要大规模并行处理的应用性能,比如HPC并行计算集群,比如机器学习训练集群,总之,它很重要。
记得Graviton2发布的时候,强调相关实例相较于x86实例有高达40%的性价比提升,而Graviton3的发布没有过于强调性价比方面的提升(虽然肯定有),而是强调在高性能计算等更多场景上的性能表现。
Graviton 3的细节已不是最重要的事
在采访中,亚马逊云科技大中华区产品部计算与存储总监周舸则不愿意多聊芯片本身,他更愿意谈的是,Graviton3实例用的好不好的问题。
但媒体似乎没有放弃各种有趣的猜测,全球许多专业媒体都在根据已知信息猜测Graviton3的更多细节,有猜测说,Graviton3用的是Arm Neoverse V1架构,有的人猜测是N2。
Timothy Prickett Morgan发表在NextPlatform上的猜测,红色字体是猜测的数据,黑体则是公开的信息。值得注意的是,媒体普遍猜测Graviton3的TDP大约为100瓦,远低于x86方案。
Graviton3采用了台积电的5nm工艺制程,Arm v8.5版本架构,主频相比上一代仅仅提升了0.1G(仅为2.6G),主频晶体管数量虽然相比上代增长了200万,而核心数量却没有增长,还是64核。
才64核?Graviton 3为什么不堆更多核心?
我们知道,2021年,国际市场上的Ampere Altra Max也提升到了128核,国内市场上的阿里平头哥半导体也发布了一款128核的基于Arm v9的处理器,为什么先搞ARM芯片的Graviton3还是64核呢,多出来200亿的晶体管放在哪儿了呢?
周舸表示,新增的晶体管主要用于提升内存带宽而不是增加核心,之所以如此选择,是考虑到Graviton用户的实际工作负载主要是大数据、微服务以及HPC,这些负载对于内存带宽和延时的要求很高,于是AWS认为提升内存比增加核数更有意义,用户的实际反馈也确实如此。
AWS的设计原则是如何以最低的成本提供更多的性能,芯片设计和实例设计需要考虑性价比,就好比司机凭经验掌握车速,把车速控制在某一个速度才更省油,AWS的EC2也要考虑类似的问题,而不是一昧的追求更主频或者更多核。
Graviton在中国市场表现喜人
此外,相信许多人都好奇基于Graviton处理器的EC2实例的市场表现,特别是在国内市场的接受度如何,对此,周舸虽然没有用数字来直接加以说明,但言语间,对于Graviton实例的市场表现还是非常满意的。
之所以有较好的市场表现,一方面是因为从x86迁移工作负载并不是太困难,周舸表示有许多负载都能在一两天内完成。更重要的一方面在于,AWS自己的很多托管服务的底层就在用Graviton,用户自己用了Graviton可能连自己都不知道。
高通如果看到这里可能会发疯,当年,高通的ARM服务器如果想替代x86服务器,必须要解决从x86硬件迁移到ARM服务器的所有问题,基本是要在整个应用生态上,重走x86多少年来走过的路,其难度可想而知,而AWS充分利用了云服务的天然优势,高通只能大呼羡慕。
高通的ARM服务器好比在大冬天里让用户从暖和的被窝爬出来,钻到另外一个冰凉的被窝,而AWS的做法则是在被窝的一头又放了一个被窝,用户不用克服任何障碍就能走到另一头,因为,Graviton用成本优势正吸引着用户自愿走向另一头。
从2018年发布以来,AWS的Graviton处理器已经度过了为期四年的考验期,实践证明,这么一折腾,居然还挺成功的。
Graviton的应用生态还在成长,AWS用各种方式鼓励开发者把工作负载迁移到Graviton实例上,包括VMware等知名企业都参与其中,Linux生态也都响应了Graviton生态,此外,AWS也有一些面向合作伙伴认证也在推行当中。