台积电应用350套H100取代4万CPU
2024-10-09
来源:全天候科技
美东时间10月8日周二在华盛顿举行的“英伟达AI峰会”期间,英伟达强调了同台积电在加速计算领域合作的成绩:英伟达名为cuLitho 的计算光刻平台正在台积电投入生产,加速计算进一步大幅提升了计算光刻这一芯片制造基石步骤的速度,并降低能耗。
英伟达称,cuLitho 将加速计算引入计算光刻领域。将 cuLitho 投入生产使台积电能够加快下一代芯片技术的开发,而目前的生产流程正接近物理学的极限。台积电应用cuLitho进行生产可以提高制造下一代先进半导体芯片的速度,并突破物理限制。
计算光刻是电脑芯片制造的关键步骤。ASML对它的定义是,利用计算机建模、仿真和数据分析等手段,预测、校正、优化和验证光刻工艺在一系列图案、工艺和系统条件下的成像性能。它涉及电磁物理、光化学、计算几何、迭代优化和分布式计算这些复杂的计算,是整个半导体设计和制造过程中计算最密集的工作负载。晶圆代工厂通常会专门为这些计算设立大型数据中心。而现在先进芯片的尺寸越来越小,降至3nm及以下,需要计算光刻更加精准,计算光刻所需的时间也越来越多。没有更强大的计算光刻很难实现复杂的掩模版设计。计算光刻历来是将新技术节点和电脑架构推向市场的瓶颈。
去年的英伟达开发者大会GTC上,英伟达发布了基于GPU构建的cuLitho计算光刻技术软件库,被称为改变计算光刻领域游戏规则的软件。cuLitho的核心是英伟达科学家发明的一组并行算法,计算光刻工艺的所有部分都可以并行运行。原来需要4万个CPU系统才能完成的工作,现在仅需用500个英伟达DGX H100系统即可完成。使用cuLitho的晶圆厂每天的光掩模产量可增加3-5倍,而耗电量可以比当前配置降低9倍。
本周二英伟达重申了今年GTC大会上披露的成绩,每年,先进的代工厂要为计算光刻耗费数百亿小时CPU计算时间,一个芯片掩模组通常可能需要 3000 万小时或更多的 CPU 计算时间,因此代工厂必须有大型数据中心。而通过加速计算,350 套英伟达H100 Tensor Core GPU 的系统现在就可以取代 4万套CPU 系统,加快了生产时速度,同时降低了成本、空间要求和功耗。
台积电CEO魏哲家在今年的英伟达GTC大会上表示,通过与英伟达一同将 GPU 加速计算整合到台积电的工作流中台积电大幅提升了性能、增加了吞吐量、缩短了周期时间,并减少了功耗。
英伟达今年的GTC大会披露,自去年推出以来,cuLitho 为台积电的创新图案化技术带来了新的机遇。在共享工作流上进行的 cuLitho 测试显示,英伟达和台积电共同将曲线流程速度和传统曼哈顿式流程速度分别提升了 45 倍和近 60 倍。这两种流程的不同点在于曲线流程的光掩模形状为曲线,曼哈顿式流程的光掩模形状被限制为水平或垂直。
本周二英伟达还提到其开发的生成式 AI 应用算法。事实证明,这种算法提升了cuLitho 平台的价值。在 cuLitho 加快流程速度的基础上,新的生成式 AI 工作流将速度又提升了两倍。应用生成式 AI 可以创建近乎完美的反向光掩模或反向解决方案,解决计算光刻中光的衍射问题,然后再通过传统的严格物理方法推导出最终的光掩模,从而将整个光学邻近效应校正 (OPC) 流程加快两倍。
OPC在半导体光刻中的应用已有三十年历史。英伟达称,三十年来,很少有像加速计算和AI这两种技术这样,为OPC带来如此迅速的转变。这些技术让物理模拟更精确,并且实现了曾经资源密集型的数学技术。
目前晶圆厂工艺的许多变化都需要对 OPC 进行修改,这增加了计算量,并给晶圆厂的开发周期带来瓶颈。计算光刻技术的速度大幅提升加快了晶圆厂创建每个掩膜的速度,从而缩短了开发新技术节点的总周期。更重要的是,它让过去无法实现的新计算成为可能。
英伟达举例称,二十年前科学文献就提出了逆向光刻技术,但由于计算时间过长,因此在很大程度上无法在全芯片规模上实现准确计算。有了 cuLitho,情况就不再如此。领先的代工厂将用它来提升逆向和曲线解决方案,这将有助于创造下一代强大的半导体。