英特尔首款服务器GPU背后的“X”野心
2020-11-12
来源: 半导体行业观察
2020年11月11日,英特尔正式发布了其首款数据中心GPU,该GPU基于Xe-LP微架构,专为高密度、低时延的安卓云游戏和流媒体服务而设计。同时宣称,英特尔oneAPI Gold工具包将于今年12月正式交付;英特尔软件堆栈推出新功能,作为其硬件、软件联合设计方法的一部分。
猛然一看,前半句像是一条具有常识性错误的新闻,英特尔怎么会发布GPU?而一但补齐GPU这一环,英特尔在XPU整个环节上将有了强大统治力,犹如秦一统六国,挥斥方遒,出兵各大处理器类型。随着布局的日趋完整,也开始发挥整体协调效应。
英特尔所谋划的一切,得从此次发布GPU说起。
Xe GPU意味着什么?
此次发布的Xe GPU与以往的集成GPU有着本质上的区别,此次GPU是首款面向数据中心的独显产品。采用英特尔能效最高的图形架构——英特尔Xe-LP微架构,拥有低功耗、独立片上系统(SoC)设计,并配备128比特管道和8GB专用板载低功耗DDR4显存。
英特尔服务器GPU
从Xe架构层面来讲,Xe是一个基础GPU架构,是一个非常灵活、扩展性极强的统一架构。此前,英特尔针对性地划分为四个微架构(Xe LP、Xe HP、Xe HPC、Xe HPG),能够应用于几乎所有计算和图形领域,包括高性能计算、深度学习与训练、云服务、多媒体编辑、工作站、游戏、轻薄笔记本、便携设备等。
对于英特尔来说,GPU在高性能技术算方面拥有高效并行性、高密度运算以及超长图形流水线等优势,绝对是不容错过的“通用向量计算”的王牌,也非常适合英特尔以数据为中心的转型战略。
不仅如此,结合英特尔本身具备的优势,形成协同效果。本次正式发布的Xe-LP GPU能够与英特尔至强可扩展处理器组合,服务提供商可在不改变服务器数量的情况下,单独扩展显卡容量,以在每个系统上支持更多流和订阅用户,并且同时实现较低的总体拥有成本(TCO)。通过在新华三3/4长、全高的x16 PCIe 3.0扩展卡内封装四个英特尔服务器GPU,即可在一个典型双卡系统中支持超过100个安卓云游戏并发用户。这一数量最高可扩展至160个并发用户,实际数量取决于具体的游戏和服务器配置2。开发人员可利用目前Media SDK中的通用API,这一API也将于明年迁移到oneAPI视频处理库(oneVPL)当中。
目前,英特尔正在与诸多软件和服务合作伙伴合作,共同将英特尔服务器GPU推向市场,其中包括Gamestream、腾讯和Ubitus。
在具体应用上,腾讯云游戏副总经理方亮表示:“英特尔是我们安卓云游戏解决方案上非常重要的合作伙伴。英特尔至强可扩展处理器和英特尔服务器GPU,打造了一个高密度、低时延、低功耗、低TCO的解决方案,让我们能够在每台双卡服务器上生成超过100个游戏实例,诸如《王者荣耀》、《传说对决》。”
此外,据英特尔表示,基于Xe-LP微架构的英特尔服务器GPU将于今年正式出货。与近期推出的英特尔锐炬 Xe MAX独显一道,该GPU将随着英特尔Xe架构产品和软件计划的不断深入发展进一步为全球用户提升视觉计算体验。
纵观英特尔所有拥有的所有处理器类型,在数据中心领域,GPU似乎是迟来的一位。当外界在不断思考“某PU”适应未来计算的时候,英特尔却提出了XPU战略,以上帝视角俯瞰着整个计算领域。科技发展总需有人最先碰壁,XPU战略的提出看似太过雄心壮志,却是一次很具前景的引领和尝试。
英特尔的“X”心思
巧合的是,Xe架构、XPU、智能X效应,都藏着一个“X”,且背后的含义都是“灵活”、“统一”,这种概念似乎深入到英特尔的骨髓里,以至于起名都往“X”上靠。
放眼整个科技发展的大背景来说,X又代表着混乱,一个数据大爆炸时代的混乱,数据种类不同,传感器的种类也大不一样,数据获得的途径也千差万别。对于英特尔来说,目前已经掌握了CPU、GPU、ASIC、FPGA四种不同架构。其中,CPU适合标量运算,GPU可用于矩阵运算或者加速器,ASIC等定制的可编程硬件可作为AI专用的加速器。空间运算,即在矩阵中用最少的路径计算,可以用FPGA实现流程定制。
此前英特尔提出的“超异构计算”就是典型的融合统一的思维,即采用多功能、多架构的芯片处理和加速不同的运算负载,采用封装集成技术将计算单元封装在一个SoC,并具备统一异构计算软件的计算架构。通过异构的排列组合,可以实现定制化需求。
以XPU为中心,继续往上游走就是英特尔“六大技术支柱”,往下游走就是英特尔的“智能X效应”。
前者为制程与封装、架构、内存与存储、互连、安全、软件。此前英特尔中国研究院宋继强表示,计算需求无处不在,而且日益多样化,CMOS缩放、3D工艺技术、新架构、新功能等将继续推动摩尔定律向前发展,但是任何单一因素都不可能再满足多元化的未来计算需求,而基于六大技术支柱的指数级创新,将是英特尔进入未来10年乃至下一个50年的驱动力。
后者既是产业效应,也是经济效应。英特尔公司全球副总裁兼中国区总裁杨旭在媒体见面会上第一次提出“智能X效应”时就表示,万物智能化带来指数级数据爆炸,智能科技的发展和应用,释放数据的价值,使产业升级、经济升级迈向新拐点。具体来说,就是增值服务的智能化、跨产业的融合,深入到各行各业。
从技术到生态布局,融合、统一的策略代表着英特尔对未来的构想,但背后的挑战非常巨大,每一个技术分支都会有来自世界顶尖公司的挑战,让外界觉得英特尔疲于应对,从而某些技术分支稍有落后。但从整体性来看,所有的技术布局都是英特尔滚滚向前的燃料。
oneAPI的魅力
以上所述的XPU战略,涵盖了英特尔所有硬件布局,如果仅此而已,对于开发者来说就是杂乱无章的。oneAPI的存在,完美了解决了不同架构硬件在软件端互联的问题,也符合了英特尔统一融合的思想理念。oneAPI将定义和引领一个人工智能日益融合、异构及多架构的编程时代。
oneAPI是一个统一的、简化的编程模型,旨在简化跨多架构的开发过程(如CPU、GPU、FPGA、加速器)。提供一个通用、开放的编程体验,让开发者可以自由选择架构,无需在性能上作出妥协,也大大降低了使用不同的代码库、编程语言、编程工具和工作流程所带来的复杂性。相对于今天的基于单个厂商的封闭式编程环境,oneAPI为开发者提供了极富竞争力、也更先进的可替代选择,帮助他们在保留现有软件投资的基础上,搭建一座无缝连接的桥梁,从而为未来的多架构世界创造更多丰富的应用程序。
据英特尔宣布,英特尔oneAPI Gold工具包将于12月在本地和英特尔DevCloud上免费提供,同时还将提供包含英特尔技术咨询工程师全球支持的商业版本。英特尔还会将英特尔Parallel Studio XE和英特尔System Studio工具套件迁移到oneAPI产品中。
此外,英特尔DevCloud平台可供开发者在各种英特尔架构上测试代码和工作负载,现已增加了新的英特尔?锐炬? Xe GPU硬件。英特尔锐炬Xe MAX 图形显卡现在也可供公开访问;同时,Intel Xe -HP已开放给特定的开发者使用。
oneAPI得到了业界的支持,近期微软Azure和谷歌的TensorFlow已经宣布支持oneAPI;众多领先的研究机构、公司和大学也支持oneAPI。
如果说XPU是英特尔自身广泛而综合实力的体现,oneAPI则是英特尔以技术为基础而建立的生态帮派。英特尔公司战略的基础都为统一、融合,就像秦统一六国,有了自己硬件基础后,开始统一文字、货币、度量衡这种软实力。从竞争对手的收购动作来看,似乎也想效仿英特尔的策略。当下谁都无法对未来计算的形式下最终结论,最好的策略就是看准某一大方向,通吃所有计算形式,变成滚滚向前的巨轮,直到碰壁,并撞碎它。