一位美国半导体大牛谈中国IP及异构计算发展机遇
2019-08-29
作者:张国斌
来源:电子创新网
目前,中国已经是世界第二大经济体,在移动支付、智能手机、家电、汽车等众多信息技术、电子产品、大宗消费品领域市场位居全球第一。但是在全球集成电路产业格局中中国自主创新的比重还是偏小,尤其是涉及到集成电路产业链最上游的核心IP环节,几乎是空白。IP代表了一个国家集成电路产业的创新水平和创新能力。以美国为例,Intel、英伟达、赛灵思这些芯片巨头都聚焦基于自主IP的原始创新、设计创新和架构创新,而中国的芯片公司更多的是尝试应用创新、集成创新和采用最新的工艺。中国已经有近1700家IC设计公司,但是99%的公司的核心IP(CPU、DSP、GPU等)都许可自ARM、CEVA、Cadence等少数几家外国公司。中国应该有自己的“ARM”,而不是把中国集成电路的核心知识产权、关键技术的创新能力寄托在别人身上,应该尽快完善和提升在供应链、产业链中处于关键地位的IP技术。值得注意的是,伴随着开源指令集RISC-V大受青睐,IBM Power、MIPS等老牌指令集陆续开源,在这种情况下,是否还需要发展本土处理器IP,让我们看看一位美国技术大牛的见解。
在近日召开“中国(深圳)集成电路峰会”上,电子创新网专访了华夏芯(北京)通用处理器有限公司的CTO John Glossner博士。Glossner博士是全球异构系统架构HSA联盟主席、软件无线电协会(Wireless Innovation Forum)董事兼秘书长,同时还兼任华夏芯美国子公司Optimum Semiconductor Technologies(OST)的首席执行官。Glossner博士拥有120多篇论文和36项专利,是处理器领域的大牛,他分享了中国本土IP发展的一些思路。
华夏芯CTO John Glossner博士
据Glossner博士介绍,华夏芯是中国唯一一家同时拥有全自主高端CPU、DSP、AI等处理器IP核、从事IP授权和芯片定制化设计的商业化集成电路企业。“我们是全球芯片公司和终端产品厂商的深度合作伙伴。在应用选择上,我们一直瞄准智能驾驶、安防监控、机器人、计算机视觉、智能家居、工业互联网、物联网、5G等新兴领域。一是看好这些领域未来的市场潜力,二是这些领域不存在所谓的生态问题和垄断巨头” 。他指出,“随着摩尔定律逐渐走向极限,我们进入了后摩尔时代, IC设计的新趋势是从单纯追求先进工艺演进到积极推动架构创新。异构设计创新将大放异彩,而且这个趋势不会改变” 。
Glossner博士指出异构计算之路始于GPU,从仅仅作为图形处理加速器转变为可用于执行常规计算功能,如应用在AI领域进行天气预报等。“问题是还必须通过CPU控制GPU,这通常意味着不得不采用基于操作系统调用的IO操作来实现昂贵的、往返多次的数据复制。而异构系统架构(HSA)带有缓存一致的共享虚拟内存,允许所有处理器在相同的内存地址空间工作,无需I/O重复操作” 。传统系统架构中两个处理器仍然有独立的开发环境,并且更难的是不同供应商的GPU就有不同的工具链和指令集架构(ISA)。因此,一个名为HSAIL的虚拟指令集(类似一种异构的Java-esque虚拟机)被开发出来,可以提供一个通用的编译器中间表示(IL),该中间表示(IL)随后被“finalized”到每个物理GPU指令集上。“异构系统架构(HSA)后来将HSAIL扩展到DSP和FPGA上” 他进一步解释说。
目前华夏芯已经推出了一套名为Unity的异构指令集平台,适用于不同类型处理器的设计,如CPU、DSP、GPU、AI等。它的一个关键优势是为程序员提供了一个可用于开发、编译和调试程序的统一工具链。与其他大多数系统相比,这大大提高了处理能力。“我们将为许多不同类型的异构系统提供可授权IP内核,并提供包含CPU、DSP、Vector和AI处理单元的经过验证的芯片。我们已经将这些IP内核集成到华夏芯的一款GP8300 SoC中,其中包含4个缓存一致的CPU/Vector处理器以及2个面向边缘应用的AI加速器” 。Glossner博士指出。
GP8300是面向视觉分析和AI加速计算的高性能SOC,用28nm工艺设计,集成了华夏芯自主架构的4核64位超标量CPU和2核AI专用处理器,适用于辅助驾驶(ADAS)、智能监控、机器人、边缘计算等应用。
Glossner博士表示从异构计算的应用场景来看,异构计算非常适用于5G相关应用,包括无人驾驶、智能安防、数据中心、智能手机等各种场景。目前,这些领域正不断涌现出各种异构创新的产品。
在芯片工艺成本不断指数级提升的今天,业界已经达成的共识就是:通过异构计算在提升性能、降低功耗的同时,减少芯片工艺相关的投入,降低设计和编程开发的门槛。尤其我们进入了智慧物联网时代以后,通过异构实现传感器的融合,更满足了AIoT的需要。
Glossner博士认为异构计算也是中国、甚至全球处理器行业打破传统巨头垄断的最有可能的领域。物联网、云计算、大数据、人工智能的快速发展给信息产业带来了巨大的发展空间,但同时对芯片提出了全新的性能、功耗等方面的要求。基于异构计算架构的芯片,或称之为“CPU+”,是把CPU、GPU、DSP、AI加速器等不同类型的处理器内核高效地融合在同一颗芯片上,实现协同运算、协同存储与协同管理,在性能、功耗等技术指标上与现有同构多核处理器相比较,有数倍甚至数十倍的提高。
为了推广异构计算,全球异构系统架构(HSA)联盟强调了生态共建、资源共享(包括软件库的重用、共享)的战略发展定位。作为全球异构系统架构HSA联盟主席Glossner博士积极推动异构计算,他认为HSA就是一套免版税的开放式API,旨在实现异构计算平台对程序员的友好。HSA的目标是使异构系统的编程既高效又简易。缓存一致的共享虚拟内存避免数据副本,API提供支持python,C++等多种语言的统一编程环境。
Glossner博士认为异构计算为中国集成电路产业提供了良好的发展机遇,因为在这一领域,各国IP公司基本处在同一起跑线上,有些技术方面中国甚至做了不少的基础研究工作。如果能抓住这一难得的历史机遇,从异构计算的IP领域切入,完全有可能深度影响甚至推动全球异构计算产业的发展。比如,为推动中国异构计算的产业化发展,HSA中国工作组CRC于2017年成立,目前已有近40家会员,主要承担HSA在全球最大的市场推广和完善HSA标准的重任。以CRC为基础,又成立了中国异构计算标准(CSH)组,一批包括安全、片上互联、软件无线电的标准草案即将发布。
对于当前热门的AI芯片,5G芯片,Glossner博士认为,在采用异构计算体系架构后,芯片相关的性能、功耗等核心指标都将出现相当显著的改善。与此同时,它们的系统能力与用户体验都将实现大幅提升。
另外,Glossner博士指出和目前火爆的RISC-V相比,华夏芯的指令集从一开始就是为异构计算而设计的。华夏芯特别希望在统一指令集内,在相同的编程环境内,支持CPU、DSP、Vector、AI等。“我们ISA的一个关键优点是每个实现都可以运行用户程序。这意味着如果GPU正在忙于运行3D图形,并且假设矢量DSP可用,即使执行速度可能没有GPU那么快,仍然可以在DSP上运行用户程序。我们的另一个优点是向程序员提供了一个通用工具链。这意味着他们不必担心控制代码的CPU工具链和每个加速器的工具链不同,这可以显著提高程序员的工作效率” 。Glossner博士指出,“RISC-V主要是一个CPU指令集。有些团体定义了RISC-V的扩展,包括DSP和GPU扩展(这一点和华夏芯很像),但它们还不是官方架构的一部分。对于一个需要平衡各方利益的基金会来说,这一道路还很漫长” 。
“但是,华夏芯的异构架构发展速度会很快。” Glossner博士表示,“针对两年内热门的5G和AI落地应用需求,华夏芯为CPU、矢量DSP和卷积神经网络(CNN)提供经过硅验证的可授权IP。这里面的每一个处理器都有一个自己的路线图,其中一些已经处于第三代设计中,每个处理器系列都各具特点。此外,所有IP内核都是客户可配置的。在未来,除了持续增强我们当前的IP产品外,您还可以期待看到新的GPU内核和更广泛的AI功能。除此之外,我们还为客户打造了包含我们IP内核的SoC,针对包括AIoT、边缘计算、智能家居、智能城市等多个市场。对于一些客户而言,构建高集成度异构芯片可能非常具有挑战性。因此,我们可以为这些具有挑战性的SoC设计提供支持” 。
据悉,目前GNN是华夏芯新一代的FPGA加速器平台,它的编译器能够直接将网络模型转换成FPGA的网表,其特点是:1、FPGA利用率高、高性能、低功耗,适用于数据中心(超大规模负载的实时AI处理)和嵌入式应用;2、单管道、较低延迟,适用于需要实时性能的应用、视频流对象检测与识别。
华夏芯董事长李科奕曾指出:“纵观全球,以异构计算为代表的半导体产业新的赛道正在构建,新的生态也正在形成,这一点应该引起国内同行的关注,毕竟这是一个由人工智能推动的、新型计算快速发展的黄金时代” 。
在这场全新的竞赛中,应当超越传统的思维方式,采用颠覆式创新路径才可能把握新机遇、开创新格局。