终于找到一款性能超过英特尔的国产AI视觉芯片
2020-11-30
来源:半导体行业观察
近日,半导体行业观察记者从《人民日报》客户端看到了一篇文章,提出:“人工智能计算机视觉芯片性能利用率衡量标准就是:在运算图片的时候,既要保证图片的精度(准),又要保证运算的速度(快),是否又‘快’又‘准’。” 这引发记者深刻的思考一个问题:我们经常高举着“名义算力”的旗帜,却忽略了芯片的实际计算效率、功耗、成本、以及元器件是否稳定可靠。在单位算力下,是否能将图片运算又“快”又“准”,实际上是每一个应用和系统厂商切实关心的实际问题,也是衡量智能视觉处理器的标准。
为了弄清楚“名义算力” 和 “芯片实际利用率” 之间的差异,记者非常好奇的将一颗在计算机视觉领域长期处于翘楚的Intel Movidius Myriad X 芯片,与《人民日报》提到的肇观电子N161进行了比较。
之所以把这两颗芯片进行比较,是因为我们熟悉Intel。无论在任何品牌的PC机,还是笔记本,或者是平板电脑上,都能够看到无处不在的 “Intel 某款芯片 inside” 标签。而我们知道,英特尔的威力根本不仅限于此,在数据中心、工业制造等各个方面所占据的霸主地位,也如同它为PC、笔记本、平板电脑提供芯片的地位一样,无可撼动。
2016年,Intel芯片设计将触角伸到了计算机视觉领域,收购了计算机视觉公司Movidius。Movidius Myriad VPU 是Intel第一个用于深度神经网络推理的视觉处理单元芯片。Intel的这项收购也可想而知的,在计算机视觉领域,移植了它在其他领域的霸主惯性思维。
▲ Movidius Myriad X 芯片
▲肇观电子N1系列芯片
在计算机视觉领域,让机器像人一样去分析图片,不管是把图片上的内容进行分类(分辨出人、车、房、树), 还是将图片内容进行检测(检测出男人、女人、老人、孩子,以及他们所处于图片中的位置),或者是将一张图片的不同内容进行分割(人脸上哪里是眼睛、哪里是口罩),等等,都需要用高性能的芯片将不同的算法部署到实际的应用上。
▲检测到图中的狗、猫、兔子
针对于实现图片分类、检测、分割等功能的算法,每个算法公司会根据自己的需求研发出不同的算法,衡量一颗计算机视觉芯片的AI性能是否优秀,需要看它在跑不同算法的时候,是否能够在单位算力下运行更多帧图片,并且还要保证算法精度不损失。
▲在保证FP16精度的情况下,针对6种算法,
N161和Myriad X芯片每秒可计算的图片数量
记者邀请了算法工程师随意挑选了几种常用的图片分类算法和图片检测算法,让两颗芯片同时跑这些算法,惊讶的发现了两颗芯片在单位算力下,每秒能跑的帧率所呈现出的不同的结果。ResNet-50、Inception V3、MobileNetV1、MobileNetV2 是常见的用于图片分类的神经网络算法,MobileNetV1_SSD、YOLOV3 是常见的用于图片检测的神经网络算法。以MobileNetV1算法为例,为了达到图片分类的目的,算法工程师用肇观电子N161芯片跑算法,每单位算力/每秒可以跑181.49帧,用英特尔Myriad X芯片来跑同样的算法,每单位算力/每秒只能跑106.15帧。
单位算力下跑得快有什么现实的意义?
▲根据货物的大小、形态、颜色,自动分拣
在一个用于货品分类的智能工业相机场景,传送带上面的货物需要被连续拍摄、检测和分类,传送带的传送速度要和智能相机的计算能力相匹配,如果传送带传得快但是相机计算不过来,就会导致整个自动控制系统的失效;智能相机计算得越快,传送带就可以传送的越快,产线吞吐率就能得到相应的提升,生产效率就能提升。
▲靠人眼看回放进行监控
在智能安防领域,建设城市视频监控系统是实现城市安全和稳定的重要基础,是“平安城市”建设的重要组成部分,更成为“智慧城市”的重要载体。传统的安防监控只能达到“看得见”的功能,公安机关需要靠人眼追溯录下的视频来破案,而肇观的芯片应用到智能安防领域,能够让摄像头“看得清”,“看得懂”,极大提高破案效率,甚至将案件防范于未然,把大量重复简单的工作留给机器去解决。
每个应用和系统厂商都在寻找在性能、功耗、成本等方面综合因素下合用的AI芯片。AI芯片是否适合使用,往往从每元钱能获得的性能、每度电能获得的性能、部署实施的成本、元器件是否稳定可靠等几个方面来衡量。据悉,肇观电子的N161芯片得到的某些客户反馈称:用1T的算力部署的系统的性能达到了其他厂商宣称的4~5T的水平。这充分说明了芯片实际利用率是检验芯片AI性能的金标准。