《电子技术应用》
您所在的位置:首页 > EDA与制造 > 业界动态 > 超越 i9-10900K!AMD Ryzen 5000系列处理器Zen 3架构分析

超越 i9-10900K!AMD Ryzen 5000系列处理器Zen 3架构分析

2020-11-13
来源:EETOP

  在过去很长的一段时间中,AMD一直无法在桌面处理器的单核心性能领先Intel,只能靠着在单一处理器封装塞入更多核心,以及设定较低的价格,与对手在市场相互拼搏,然而AMD却透过Ryzen 5000系列处理器反转此一情况,就让我们一起来看看Zen 3架构的改变之处。

  重新设计整体架构

  AMD在2017年的时候就曾宣示,他们将提供世界上最好的桌面处理器(We wanted to deliver the best desktop processors in the world andchange the industry along the way.),如今他们透过Zen 3架构的Ryzen 5000系列处理器达成这一目标,我们通过性能实测,看到Ryzen 9 5900X的性能确实能超越其主要竞争对手Intel Core i9-10900K。

  继AMD先前推出的Zen与Zen 2架构后,Zen 3的是款完全重新设计(Ground-up Redesign)的处理器架构,包含强化前端、执行引擎、存取、SoC架构等部分都经过改善,并带来了显著的性能与功能提升。

  强化前端的目标为增加大量分枝的大型程序预取(Fetching)性能,尤其在大量分枝的大型程序,将L1分枝预测的缓冲区加倍至1024个,并增加分枝预测器的通道宽度,增加预测错误的回复速度,提升循序预取性能,并让切换cache流水线的粒度更细。

  在执行引擎部分,新架构的设计目标为缩短延迟并加大架构以提高指令等级平行化(ILP,Instruction-Level Parallelism)的能力,在整数数据取用器、整数窗口、浮点数通道宽度、浮点数乘积累加运算等部分也都进行最佳化与性能提升。

  存取方面的改良目标为扩大架构并强化预取能力,以满足执行引擎所需的更大量数据吞吐量,数据读取与写入的时钟频率较Zen 2皆有所提升。

1.jpg

  ▲ Zen架构的旅程始于2017年,到现在已经进入Zen3世代。

2.jpg

  ▲ Zen3改进的重点为提升IPC/单核心性能、降低延迟、提升功耗效率。

3.jpg

  ▲ Zen3重新设计整个处理器,前端、执行引擎、存取、SoC架构都有改进。

4.jpg

  ▲预取与解码区块的架构也有所更新,以降低分支预测的延迟。

5.jpg

  ▲ Zen 3透过多项功能改善,达到IPC平均提升19%的成就。

6.jpg

  ▲这19%来自Cache预取、执行引擎、分枝预测、微指令Cache、前端、存取等各项性能改进的贡献。

  打破CCX屏障

  Zen 3的另一项重大改进,就是改进了SoC架构,目标同样以降低延迟为主,同时缩短处理器核心对核心、核心对Cache、主存储器等数据存取的延迟,并将L3Cache丛集增大1倍。

  在Zen 2架构的设计中,单一处理器封装最多可以容纳2组CCD(Compute Die,运算裸片)与1组IOD(Input/Output Die,输出入裸片),每组CCD最多可以容纳2组CCX(Core Complexes,核心复合体),而每组CCX最多可以容纳4个处理器核心。举例来说,可以透过2组具有4个处理器核心的CCX,组成1组CCD,达成8核心处理器配置。

  而Zen 3则将CCX可以容纳的核心数提升至8个,每组CCD则只能容纳1组CCX。因此8核心处理器会有1组具有8个处理器核心的CCX,组成1组CCD。

  这样最大的好处是可以把原本每组丛集只能容纳4个核心的架构,改变为可以容纳8个核心,且把原本的2组16MB L3 Cache存储器,合并为1组32MB的组态。

  如此一来可以缩短处理器核心之间通讯的延迟,例如在Zen 2架构中如果位于不同CCX的处理器核心的需要沟通,则某核心需透过Infinity Fabric将数据传至IOD,再由IOD交至另一核心,将会因为传输延迟而影响性能,若处理器核心位于同一CCX则无此问题。

  另一方面,统一的32MB L3 Cache存储器也比拆分为2组16MB更具效率,且能容纳更大笔的数据,有助于提升游戏性能表现。

  在制程方面,Zen 3的CCD采用与Zen 2一样的台积电7nm节点制程,并继承在Ryzen 3000XT系列处理器所纳入的设计改良,因此能再次推升最高时脉。IOD则完全延用先前12nm制程与设计,并让处理器相容于先前推出的500、400系列芯片片组。

7.png

  ▲Zen 3大改了CCX的组态,将原本只能容纳4个处理器核心的限制提升至8个,也让2组16MB L3 Cache存储器合并为统一32MB区块。

8.png

  ▲这样的改变也让8个处理器核心能共享同一块L3 Cache存储器,有助于提升多工性能表现。

9.jpg

  ▲以8核心的Ryzen 5000系列处理器为例,处理器封装中包含CCD(其中有1组CCX)与IOD各1组。

10.jpg

  ▲ 16核心部分则有2组CCD与1组IOD。

11.jpg

  ▲首波推出的4款Ryzen 5000系列处理器价格从美金299元至799元不等,其中只有Ryzen5 5600X附上Wraith Stealth散热器。

12.jpg

  ▲相较前代的Ryzen 3000XT系列处理器,Ryzen 5000系列处理器的同级产品皆涨价美金50元。

  整体而言,Ryzen 5000系列处理器的「历史定位」在于单核心性能超级Intel旗舰产品,且依然维持核心较多的优势,因此无论在单核心或多核心程序表现都能追上或超越Intel(也需考虑软件、编译器、指令集等最佳化因素造成的性能影响),在游戏、电竞、美术设计、影片编辑、电脑辅助制造(CAM)、电脑辅助设计(CAD)等应用上都能带来性能优势。

  比较可惜的是,Ryzen 5000系列处理器较同级的Ryzen 3000XT贵了50美元(如Ryzen 5 5600X与Ryzen 5 3600XT相比),这样的定价策略当然可以解释为新款处理器带来更大的性能提升,但仍与消费者的期望相左。

  有趣的是,在AMD发表Ryzen5000系列处理器的消息后,Intel也不甘示弱,以RocketLake-S处理器反击,并不小心把牙膏挤太大力,对于消费者而言,这样一来一往的竞争往往能让产品的性能、价格更加亲民,或许双方未来都会陆续更贴近市场需求以得到消费者的青睐。


本站内容除特别声明的原创文章之外,转载内容只为传递更多信息,并不代表本网站赞同其观点。转载的所有的文章、图片、音/视频文件等资料的版权归版权所有权人所有。本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如涉及作品内容、版权和其它问题,请及时通过电子邮件或电话通知我们,以便迅速采取适当措施,避免给双方造成不必要的经济损失。联系电话:010-82306118;邮箱:aet@chinaaet.com。