泡沫过后,沉淀下来的AI芯片将落在何处?
2020-09-04
作者: 杜芹DQ
来源:半导体行业观察
前几年的“人工智能热”让大小厂商陆续跳入AI芯片的研发大军中,而当这股潮水褪去,当初的50多家公司大多数都黯然退出历史舞台,如今只剩10家左右。AI芯片的风口已然过去。据艾瑞咨询发布的2019年《AI芯片行业研究报告》指出,目前AI芯片行业接近Gartner技术曲线泡沫顶端,只有通过市场检验和筛选的优质团队才能够继续获得产业、政策和资本的青睐与支持。
随着AI芯片进入深水区,人们更关注的不再是单纯的算力,还有对应用落地和商业化的支持:进入了哪些场景?合作了哪些客户?有没有软硬一体化方案?是否已经有实际案例?……“AI落地难”已成行业共识,浮华过后,AI芯片接下来将进入市场检验真理的阶段。
AI芯片为何落地难?
首先,我们来看下当前AI芯片的格局。目前市面上AI芯片主要分为云端AI芯片与终端AI 芯片,云端AI芯片主要部署在大型服务器中,可支持图像、语音等不同类别的AI 应用;终端芯片则被放在音箱、摄像头等硬件设备中。由于云端芯片起步较早,且所需要协同的CPU/GPU等硬件成本投入规模高,该领域已被英伟达、Intel等巨头瓜分殆尽;国内一众AI从业者大多选择发力在终端芯片领域,如自动驾驶、安防、零售、智能硬件等。但AI芯片终端市场细分化、碎片化、应用场景不明确也是一大难题。
至于AI芯片落地难的原因可能有无数个。例如,芯片研发比AI语言的更迭速度慢,当芯片面市时,其采用的AI语言可能已经过时了。这种问题首先体现在量产,但归根结底,缺乏杀手级应用场景才是最致命的。AI芯片厂商高投入研发过后,却不知道自己的产品要卖给哪些客户或者说应用到哪些产品上,无法找到可持续性的落地场景。
地平线的联合创始人兼副总裁黄畅表示,缺乏杀手级应用使得现有的AI芯片大多没有清晰的定位,无法高度优化PPA。做半导体的都知道PPA有多么重要,尤其是Performance。AI芯片需要针对应用场景进行设计,以此来指导研发调整优化方向,引导客户进行正确选择,同时能够促进行业有序协同向前发展。
再者,用户接受度也不高,AI应用所需要的数据闭环难以形成。需要明确的是,AI应用开发模式与传统软件开发流程不同,传统软件开发可清晰定义功能,通过编程就能实现;而AI应用则要通过示例(数据)来定义功能再进行开发,需要形成数据闭环,且自动迭代。
“AI是一个全新领域,AI芯片需要支撑的不仅是AI计算,更要面向场景,实现完整的功能。芯片公司多年的积累不是主要矛盾,其主要矛盾是如何将软硬件结合起来,开发出一个高效能、低功耗、低成本,同时能够又快又准的完成自主机器人的任务。AI芯片的成功不止于将ISP调的好,能够看清楚;也不是将传统的语音算法做的更精进,更不是说一个传统的车规芯片公司把CPU和DSP升级成一个NPU,AI芯片没有那么简单。”黄畅如是说。
在纷繁复杂的碎片化终端市场中,最需要什么样的AI芯片?黄畅认为:“需要的是能极致优化PPA的AI芯片,这个PPA的提升需是数量级的,要能适应未来数年的算法演进,同时充分考虑算法发展,从而能真正替代GPU。”
但黄畅也告诉半导体行业观察记者,目前AI芯片也有其可取之处,例如,大多数AI芯片的工具链都能对场景深度学习框架有比较好的支持,也培养了一些开发者,在开发成本上有一定的降低,减少了对于Cuda之类的编程生态的依赖。
谁来定义AI芯片的“好坏”?
都说AI芯片难落地,客户难评判,那么一款AI芯片的“好坏”究竟如何来评估呢?是TFLOPS?是TOPS?还是MLPerf?AI芯片界好像依然没能找到完美体现真实性能的衡量标准。
为何这么说?目前业界惯常使用的芯片评测标准有两种,一是峰值算力,但这只反映AI芯片理论上的最大计算能力,而非在实际AI应用场景中的处理能力,具有很大的局限性;二是目前行业较为知名的基准测试组织MLPerf,但其采用的模型少且更新速度滞后于算法演进的速度,无法及时反映算法效率的提升以及各种精度下芯片能够达到的计算速度,因而无法描述芯片AI性能的全貌。
针对当前AI芯片评测中存在的问题,地平线提出MAPS(Mean Accuracy-guaranteed Processing Speed)评测方法,针对应用场景的特点,在精度有保障的前提下,包容所有与算法相关的选择,评估芯片对数据的平均处理速度。为行业提供一个评估芯片AI性能的全新视角。
“评估芯片AI性能,本质上应该关注做AI任务的速度和精度,即‘多快’和‘多准’。”
黄畅介绍说:“MAPS评测方法,能关注真实的用户价值,将每颗芯片在‘快’和‘准’这两个关键维度上的取舍变化直观地展现出来,并在合理的精度范围内,评估芯片的平均处理速度。这个方法具有可视化和可量化的特点。”
MAPS 聚焦“快”和“准”两个关键评测维度,用最优帧率精度所围面积直接体现 AI 芯片的最强能力
按照黄畅的说法,这个全新的MAPS评估方式对行业来说有六大创新之处:
第一,它将芯片的Benchmark通过图形变得可视化,表达更精准;
第二,该方式关注真实、面向结果的需求,只在乎精度和速度,不在乎中间任何关于算法的取舍和选择;
第三,可以统一表示精度与速度,关注主流精度区间;
第四,隐藏与最终结果无关的中间变量,包括模型、输入大小、批处理的量是多大;
第五,通过MAPS评估方法可以在算力之外帮助用户理解这个芯片到底能跑多快以及多好;
第六,留有最大的空间引导客户使用最优的方式使用某一颗芯片,这一点非常重要,是去真正指导客户使用这个芯片的最佳实践。
芯片是个生态系统,单独依靠一家之力是玩不转的。地平线的MAPS评估标准最重要的意义是让行业能够形成一种合力,让大家更好的协同,不管你是买方还是卖方,大家都有一个相对清晰的目标,容易形成共识、形成协力,这样才好健康地去推动整个行业往前发展。黄畅表示。
AI芯片花开两朵:“旭日”东升,“征程”万里
有了好的评估标准之后,AI产业向好,经历过大风大浪的AI芯片,最终将落在哪些场景中呢?作为一家以“为客户提供的智能化价值”的人工智能公司,地平线将其AI芯片的种子洒向了AIoT和自动驾驶航道,花开两朵,同心向阳。
“做AI芯片需要企业有很强的洞察力,要在三五年前找到落脚点,以创造真实的价值为导向,本着长期主义的精神坚持不懈的走下去。”黄畅谈到。
自动驾驶被看作是AI芯片的杀手级应用的潜力市场,近年来伴随智能驾驶渗透率的提升,全球芯片巨头也在纷纷向汽车这个产业靠拢。汽车AI芯片市场未来仍是各大巨头竞争角逐之地。目前在AI自动驾驶方面,国外的英伟达、英特尔、特斯拉,国内的华为、地平线、寒武纪以及芯驰科技等一众厂商都在深耕这个领域。
地平线是中国最早进入AI芯片领域的人工智能企业。2015年,在国内AI芯片仍未进入大众视野时,地平线公司成立,率先提出软硬结合的BPU芯片架构;2017年,发布中国第一款边缘AI芯片:旭日一代和征程一代;2018年,征程芯片助力国际顶尖Robotaxi车队;2019年,宣布正式量产中国首款车规级AI芯片征程2。
这几年,地平线在商业化的道路上越走越稳。就拿征程2 来说,该产品可全方位实现车内场景化感知,并基于感知结果为用户提供更精准的智能推荐以及智能车控等服务。
今年3月份,地平线征程2登陆长安UNI-T前装量产,使长安UNI-T成为首款搭载国产人工智能芯片的智能汽车,而且也让它走在了世界前列,成为全球首款智能人机交互SUV。
众所周知,车载AI芯片是人工智能行业的珠穆朗玛,也是自动驾驶实现大规模落地的前提。车规级芯片产品的开发周期长、难度大,是硬科技、长跑道的创新。在汽车芯片如此高标准以及长供货周期、与主机厂长久的合作关系下,汽车芯片一旦能够量产,其供应格局相对来说就较为稳定。
虽然,相比市场前景更大、场景更为复杂的自动驾驶,地平线在AIoT领域的声量较小,但其重视程度丝毫不差。据了解,其旭日系列芯片所服务的客户已过百家。去年发布的旭日2的表现也相当亮眼,在旭日2上的实际测试结果表明,分类模型 MobileNet V2 的运行速度超每秒 700 张图片,实际性能能够达到甚至超过业内标称 4TOPS 算力的 AI 芯片。
在AIoT领域,地平线坚持底层技术能力研发与解决方案的打造,加速普惠 AI 时代到来;在开发者生态方面,地平线则通过工具链服务降低开发者门槛,助力上层应用产生,以此丰富整个 AIoT 应用生态,用行业的力量推动行业。目前,地平线已携手上百家 AIoT合作伙伴为产业提供赋能服务,实现线下场景服务数千万人口。
结语
自去年旭日2的发布,又经过近一年的商业化落地和技术锤炼,面向AIoT市场的旭日3正呼之欲出。在此,想剧透下,此前,地平线有在ImagetNet模型上进行了一项MAPS测试,下图中有一颗地平线即将推出的芯片,在与表现最优的标称11.4TOPS峰值算力的AI芯片对比中,新的芯片虽然在高精度上稍有劣势,但在追求速度和低延迟等场景中会有不俗的表现。9月9日上午,“地平线”尽头将再次升起一轮“旭日”!
ImageNet图像分类 75~80.5%精度范围内, MAPS 评估方式下的主流芯片测试结果(右一折线为地平线最新一代芯片测试结果)