《电子技术应用》
您所在的位置:首页 > 电子元件 > 业界动态 > GPU重大突破:“光子”架构实现移动端光线追踪

GPU重大突破:“光子”架构实现移动端光线追踪

2021-11-27
来源:21ic中国电子网

  光线追踪是指在模拟场景中对若干条模拟光线进行单独追踪,模拟光线其与场景中物体、物体表面材质的交互,从而达到全局照明场景中更真实的渲染效果。相比传统的光栅化渲染的方式,光线追踪虽然效果更好但同时对于计算资源的需求更高,传统软件实现方式并不能大规模普及开来。英伟达在2018年推出了通过硬件加速来实现实时光线追踪的桌面级GPU,这可以看作是GPU领域的一次重大突破。而今时隔3年之后,Imagination推出了全新的移动GPU平台——C系列,通过全新的“光子”架构让光线追踪进入到了移动端,成为GPU史上又一次的重大迈进。

61961c9150108 (1).jpg

  图:Imagination提供的是否开启实时光线追踪的效果对比*

  克服光线追踪进入移动端的难点

  由于光线追踪对于计算资源有着很高的要求,而移动端又非常注重功耗的表现,所以光线追踪功耗表现是其进入移动端的第一难题。据Imagination技术前瞻副总裁Kristof Beets分享,移动端面临的限制很多,一方面核心的数量没有办法无限叠加,发热和功耗都会成为很大的问题。Imagination新推出的具有光线追踪功能的C系列GPU IP,它有专门的硬件部分把光线追踪相关的计算分流到光线追踪的硬件上,来实现光线追踪的效果。其中包括光线的反射、阴影、全局照明和环境光的遮蔽。总体上可以达到整个显示效果的极大提升,同时保留原来非常低的功耗和效率。

  Imagination将新的光线追踪架构命名为“光子”。据Imagination中国区战略市场与生态副总时昕博士分享,“去创造一个新的宇宙,大家第一个想到的概念是什么?我想到上帝说的一句话”要有光“。我们要创造一个全新的虚拟世界,我们第一个需要的东西也是光,所以我们把新的光线追踪的架构命名为光子。”新的“光子”GPU架构这个专门用来进行光线追踪处理的硬件单元叫做RAC(光线加速集群),通过该硬件的加速可以实现传统 方式数倍的提升,各项性能几乎都能提高50%。以32位的CXTRT3举例:每秒钟可以计算13亿条光线的折射、反射,每秒算力达到1.5T,48G像素/s、纹理运算1.3G/s、48GBoxTest;如果做AI定点运算每秒可以达到6TOPS。

61961cb67bfd7.jpg

  在场景的渲染上,越真实的体验需要调度越多的硬件资源。根据不同的渲染等级,RAC中的不同硬件加速模块会相应的被调用,把光线遍历、追踪和监控算法通过专用的硬件来实现。当全局光照打开,数亿条光线打到物体上,将会产生非常大的计算量。Imagination会将数亿条光线通过分组的形式来进行计算,从而提高计算的效率。分组计算后的结果通过一致性检测硬件来进行簇化,将画面提升到最佳。

61961cdf78476.jpg

  将全新的RAC与之前B系列中的USC、TPU等放在一起,就可以组成一个具备光线追踪能力的移动GPU。据悉,CXT支持多核架构来实现更高的性能表现,例如4核架构最多可以达到7.8G Ray/s,同时还可以选择用专门神经网络加速器单元去做降噪的处理,将更多的资源去做图形相关的渲染计算。此外Imagination也开发了相应的软件工具,开发者可以查看每秒的光线数,测试的负载等;另外还有一个为内容开发者提供的软件开发套件,功能类似于跑在PowerVR上模拟出的效果。

  61961cf31fa0a.jpg

  光线追踪的大规模应用之路

  光线追踪的思路很早就已经出现,但受制于计算资源的需求较大,一直没能得到很大规模应用。而且在前期碎片化问题严重,一些方案均来自自有API或软件方案,这意味着内容开发者并不难在后台大量应用这些技术。专用的硬件加速的出现使其成为了可能,英伟达的硬件加速光线追踪桌面级GPU的发布是一个节点,让硬件方案进入市场并得到认可。而今Imagination的光线追踪移动GPU的发布,是一个更为重要的节点,带来了光追的大规模应用爆发的可能。

  为了进一步推进光追的普及,Imagination率先提出了一个光追的分级体系,如下图所示:0级为传统方案,可能是在图形工作站上进行几个小时的画面渲染,可能也会有一些专业的非标准化的硬件来加速。1级是后来业界在将光追算法向GPU上逐渐迁移,将CPU版本软件转换成GPU的版本,借助GPU的并行计算能力来获得数量级加速。2级中出现了更多细致的光线处理的新的方式,3级中出现了硬件BVH处理能力。据时昕博士分享,目前行业中即使是PC上的光追,大概就在2、3级的水平。第4级别是当前Imagination所发布的新产品可以达到的,这是全球第一次达到该级别的硬件处理能力。第5级上会进一步将会更多计算工作负荷从原来的GPU的渲染器或着色器中分离出来,转移到专门的硬件上去加速,从而省下更多的GPU资源来做其他动态渲染,这样可以在性能提升的同时降低功耗。

61961d1d438c6.jpg

  其实Imagination已经具备直接推出L5级别光追方案的能力,但由于现在市场并不成熟所以并没有推出。Kristof表示,没有选择现阶段推出L5级产品主要为了市场平衡考虑,Imagination跟市面上的光线追踪开发者有过沟通,如果现在推出市场上唯一的L5等级光线追踪硬件设备,因为市场没有准备所以不会有太多开发者来开发相应的应用。所以Imagaination决定先推出L4级别的CXT产品来培育市场,让游戏3D引擎、游戏开发者进入到生态中,再慢慢把光线追踪市场做大。在标准方面,现在市场上已经出现了一些光线追踪技术趋向于标准化、统一化的趋势。时昕表示,处理器的成功离不开整个生态,包括接口,包括编程的模式、工具等等。整个光追生态其中一个重要因素——API标准已经成型,包括Vulkan都有相关的标准出来,Imagination的硬件提供了可能性,上层内容开发者和工具开发者,也会遵循同样的光线追踪标准,相信很快会有很多丰富的内容出现。Imagination也积极与微软等合作伙伴进行密切的沟通,在此基础上继续提升GPU架构追求更好的PPA表现。

  ###

  据悉诸多客户已经获得了最新CXT的IP授权,按照正常的产品研发周期推算,消费者有望在2023年在移动设备上体验到硬件光线追踪方案。




mmexport1621241704608.jpg

本站内容除特别声明的原创文章之外,转载内容只为传递更多信息,并不代表本网站赞同其观点。转载的所有的文章、图片、音/视频文件等资料的版权归版权所有权人所有。本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如涉及作品内容、版权和其它问题,请及时通过电子邮件或电话通知我们,以便迅速采取适当措施,避免给双方造成不必要的经济损失。联系电话:010-82306118;邮箱:aet@chinaaet.com。