模拟电路逼近人工智能
2021-12-24
来源:半导体行业观察
未来驱动人工智能的一些最佳电路可能是模拟的,而不是数字的,世界各地的研究团队正在越来越多地开发新设备来支持这种模拟人工智能。
推动当前 AI 爆炸式增长的深度神经网络中最基本的计算是乘法累加 (MAC) 操作。深度神经网络由人工神经元层组成,在 MAC 操作中,这些层中每一层的输出乘以它们与下一层连接的强度或“权重”的值,然后将这些贡献相加。
现代计算机具有专门用于 MAC 操作的数字组件,但理论上模拟电路可以以少几个数量级的功耗来执行这些计算。这种策略(称为模拟人工智能、内存计算或内存处理)通常使用非易失性存储设备(例如闪存、磁阻 RAM (MRAM)、电阻 RAM (RRAM)、相位)执行这些乘法累加运算- 更改内存 (PCM)和更深奥的技术。
然而,韩国的一个团队正在探索基于镨钙锰氧化物电化学 RAM (ECRAM)设备的神经网络,该设备的作用类似于微型电池,以电导变化的形式存储数据。韩国浦项科技大学的研究主要作者 Chuljun Lee 指出,神经网络硬件在训练和应用期间通常有不同的需求。例如,low energy barriers有助于神经网络快速学习,但high energy barriers 有助于它们保留学到的知识以供在应用中使用。
“在训练期间将他们的设备加热到接近 100 摄氏度的温度会产生有利于训练的特性,”电气工程师John Paul Strachan说,他是德国 Jülich 研究中心的Peter Grünberg 神经形态计算节点研究所的负责人。不参与本研究。“当它冷却时,他们获得了更长的保留时间和更低的运行电流的优势。只需调整一个旋钮,热量,他们就可以看到计算的多个维度的改进。”
研究人员在12 月 14 日在旧金山举行的年度 IEEE国际电子设备会议(IEDM) 上详细介绍了他们的发现。
Strachan 指出,这项工作面临的一个关键问题是,在经过多次加热和冷却循环后,ECRAM 可能会面临什么样的恶化。尽管如此,“这是一个非常有创意的想法,他们的工作证明了这种方法可能具有一些潜力。”
另一组研究了铁电场效应晶体管 (FEFET)。研究主要作者、圣母大学的 Khandker Akif Aabrar 解释说,FEFET 在每个晶体管内以电极化的形式存储数据。
FEFET 面临的一个挑战是,当它们缩小时,它们是否仍然可以显示对 AI 应用程序有价值的模拟行为,或者它们是否会突然切换到只存储一位信息的二进制模式,极化状态为一种状态或另一种状态。
“这个团队工作的优势在于他们对所涉及材料的洞察力,”没有参与这项研究的 Strachan 说。“铁电材料可以被认为是由许多小域组成的块,就像铁磁体可以被认为是上下域一样。对于他们想要的模拟行为,他们希望所有这些域慢慢地向上或向下对齐响应施加的电场,而不是出现它们同时上升或下降的失控过程。因此,他们用多个介电层物理分解了铁电超晶格结构,以减少这种失控过程。”
该系统实现了 94.1% 的在线学习准确率,与其他 FEFET 和 RRAM 技术相比非常好,科学家们在 12 月 14 日在 IEDM 会议上详细介绍了这一发现。Strachan 指出,未来的研究可以寻求优化属性,例如当前水平。
日本和台湾科学家使用c轴排列的结晶铟镓锌氧化物制成 的新型微芯片。 研究合著者日本半导体能源实验室公司的 Satoru Ohshita 指出,他们的氧化物半导体场效应晶体管 (OSFET) 显示出每单元低于 1 纳安的超低电流操作和每瓦每秒 143.9 万亿次操作的操作效率12 月 14 日在 IEDM 会议上详细介绍的研究结果,是迄今为止模拟 AI 芯片中报告的最好成绩。
“这些是极低电流的设备,”Strachan 说。“由于所需的电流如此之低,您可以将电路块做得更大——它们获得 512 x 512 个存储单元的阵列,而 RRAM 的典型数字更像是 100 x 100。这是一个巨大的胜利,因为更大的块得到了二次方它们存储的权重具有优势。”当 OSFET 与电容器结合时,他们可以在 30 小时内以超过 90% 的准确率保留信息。“这可能足以将这些信息转移到一些波动较小的技术上——几十个小时的保留并不是一个交易破坏者,”斯特拉坎说。
总而言之,“研究人员正在探索的这些新技术都是概念案例的证明,这些案例提出了关于他们未来可能面临的挑战的新问题,”斯特拉坎说。“他们还展示了通往代工厂的道路,他们需要大批量、低成本的商业产品。”