三星加快HBM2布局,卡位人工智能
2018-01-24
近日,三星电子宣布,已经开始量产其当前市场上数据传输速度最快的第二代8GB高带宽显存-2(HBM2)——Aquabolt,这也是业内首款可提供每引脚2.4Gbps数据传输速度的HBM2。
事实上,HBM2这两年的发展不可为不迅猛。去年,AMD就宣布其旗下的Vega显卡使用HBM 2显存,并最终凭借这几款产品实现了大翻身。
那么三星押宝,AMD力推的HBM2显存到底是什么呢?
HBM到底是什么?
高带宽内存(HBM)是运用在3D堆栈DRAM的高效能内存界面,通常与高效能图形加速器或网络装置结合使用,在2013年由JEDEC采用成为业界标准,而第二代HBM2也于2016年1月由JEDEC采用。
HBM2是使用在SoC设计上的下一代内存协定,可达到2Gb/s单一针脚带宽、最高1024支针脚(PIN),总带宽256GB/s (Giga Byte per second)。1024针脚的HBM2 PHY使用硅穿孔(through-silicon via)与8-Hi (8层)DDR芯片堆栈(chip stack)做链接,这样的设计需要采用台积电的先进2.5D封装技术CoWoS。CoWoS使用次微米等级硅晶接口(中介层),将多个芯片整合到单一封装内,能够进一步提高效能、降低功耗,达到更小尺寸。
相对于传统的GDDR5显存来说,HBM无疑是更加先进的,甚至可以说是未来高速存储的发展风向标!原因也很简单GDDR5经过这么多年的发展已然来到了一个瓶颈的位置,光靠频率提升来提供更大的显存位宽已经没有太大的空间,而这势必会反过来影响到GPU的性能发挥。
这张图除了规格对比之外,还能很清楚的看到HBM的实际结构,尤其是四层DRAM叠在最底的底层die之上,虽然AMD一直也没有给出HBM本体的具体制作过程(绝对的商业机密),但是不难想象4层绝不是HBM未来发展的极限,而随着层数的增加位宽势必还会迎来进一步的增加。
相反的,HBM通过打造高位宽低频率的显存,使得在提供比较大的显存位宽的基础上不需要那么高的频率,同样的4GB容量下HBM能提供的显存位宽为4096bit,比GDDR5的512bit高出8倍,这也是为什么HBM即便只有1GHz的等效频率也能最终实现大于GDDR5的显存带宽!而且这一个优势还会随着HBM显存后期频率方面的进一步提升而进一步加大。
除了性能潜力之外,实际工作频率还关系到另外一个非常重要的问题——较高频率带来的更大幅度的功耗提升,这也是GDDR5目前的最大瓶颈。而低工作频率使得HBM的每瓦下了率足足高出3倍,相信在HBM显存的位宽随着叠层数量的进一步增加还会有所增加,那时低频率的优势还会进一步加大!
如果硬要说HBM显存技术中最重要的是什么,那绝对要算最基础的堆叠设计了,简单点说就是将传统的2D电路设计转变为立体的3D电路设计,充分利用所有的内部空间之余还能大幅减小基板的面积,从而也推进了SOC以及小型化的发展,可以说这绝对半导体行业发展的必然趋势。
三星的优势是什么?
但是众所周知,三星并不是第一个宣布推出HBM的厂商。
从AMD Fiji核心首次使用HBM显存已来,HBM已经成为下一代高端显卡的显存标准,HBM 2也正式被列为JEDEC标准。
在推动HBM发展这一点上,除了劳苦功高的AMD之外,SK Hynix也功不可没,但是悲剧的是SK Hynix在HBM 2显存上被三星截胡,AMD Polaris、NVIDIA Pascal高端显卡都会使用三星的4GB HBM2显存。
为什么能够后来居上,三星有什么优势呢?
据三星官方介绍,新推出的Aquabolt提供了最高级别的DRAM性能,具有1.2V的2.4Gbps引脚速度,相比于第一代8GB HBM2封装,每个封装的性能提升近50%。第一代8GB HBM2引脚速度分别为1.6Gbps(1.2V)和2.0Gbps(1.35V)。
经过改进,单个三星8GB HBM2封装将提供每秒307GBps的数据带宽,比提供32GBps数据带宽的8Gb GDDR5芯片的数据传输速度快9.6倍。系统中的四个新HBM2封装将实现每秒1.2TBps的带宽,与使用1.6Gbps HBM2的系统相比,这将使总体系统性能提高多达50%。
据悉,在Aquabolt中三星采用了与TSV设计和热控制有关的新技术。一个8GB HBM2封装由8个8Gb HBM2芯片组成,每个芯片使用5000多个硅穿孔进行垂直互连。虽然使用如此多的TSV可能会导致并行时钟偏移,但三星成功地将偏移降至最低,显著增强了芯片性能。
此外,三星还增加了HBM2芯片之间的热凸点数量,这使得每个封装的热控制能力更强。而且,新的HBM2在底部还有一个附加的保护层,增加了封装的整体物理强度。
不过三星指出,因为HBM需要整合到具备硅中介层(silicon interposers)的ASIC中,这种设计需要具备专长技术。
HBM2的未来
从目前的发展情况来看,HBM技术已经发展到了第二代,除了AMD之外,英伟达和英特尔都已经推出了相关的产品与应用。
去年年底,Intel就发布了全球首款集成HBM2显存的FPGA(现场可编程阵列)芯片“Strtix 10 MX”,可提供高达512GB/s的带宽,相比于独立DDR2显存提升了足足10倍。
同时,三星也表示,其8GB容量的HBM2是专为下一代超级计算机、人工智能(AI)与绘图系统所设计,号称能提供最高等级的DRAM性能水平。
现在也可以看到HBM被应用在某些超级计算机,未来在某个时间点也有机会进驻标准服务器,但是现在很难说什么应用能让HBM达到足以让成本下降的高需求量。
但是,这种技术需要克服的挑战在于,当生产量增加、价格就会降低,但因为一开始的高价格很难让生产量变大,这也是为什么HBM2仍主要只出现在高端显卡上的原因。
也是今后HBM2想要应用到人工智能,高性能计算等新兴领域的最大难点!