《电子技术应用》
您所在的位置:首页 > 嵌入式技术 > 高端访谈 > TI低功耗多核DSP引领高性能计算新时代

TI低功耗多核DSP引领高性能计算新时代

2011-11-30
作者:电子技术应用网记者:陈颖莹

    DSP产生的初衷是为了增强系统计算功能,经过近三十年的发展,DSP已经从单纯数字信号处理器发展为片上系统(SoC)。德州仪器(TI)不断增加DSP的处理能力,其DSP的处理速度已飞速发展到了10 GHz,并且在内部集成了ARM内核。然而,在绿色环保被高度关注的今天,低功耗也是DSP发展的主题之一,而不是一味的追求高性能。TI在2011年超级计算大会(SC´11)上演示了其针对超低功耗、超高性能计算应用的TMS320C66x系列最新产品TMS320C6678多核DSP,它是业界性能最高、功耗最低的DSP,这预示着全新高性能计算(HPC)时代的到来。TI中国区通用DSP业务发展经理郑小龙先生向记者介绍了相关情况。

为低功耗HPC树立榜样

    说它功耗低,到底低到什么程度呢?图1是一个C6678和知名电信计算刀片及多核处理器平台制造商研华(Advantech)开发的采用了4个C6678的半长PCIe卡DSPC-8681多媒体处理引擎的性能表。可以看到,C6678只需要消耗1 W就可以运算6 FFT GFLOP或者5.4 SGEMM GFLOP;DSPC-8681消耗1 W则可运算3.85 FFT GFLOP或者3.5 SGEMM GFLOP。也就是说,C6678 用10 W功耗就可实现160 GFLOP的性能,半长PCIe卡在50 W极低功耗下能实现超过500 GFLOP的性能。小龙介绍到:“TI和研华还将很快推出在200 W极低功耗下支持1~2万亿次浮点运算性能的全长卡,为HPC应用带来更高效率更快速度的解决方案,实现业界转型。”此外,TI低功耗SmartReflex技术也使设计更加绿色环保。

    据了解,研华发布DSPC-8681以来,该产品已经在高强度计算雷达与医疗影像应用中得到早期市场采用。TI最新系列多核开发工具的推出不但将显著加速HPC应用客户的评估,而且还将在超级计算领域全面发挥C6678多核DSP的潜力。

继续创高性能计算新“低

    C6678基于C66x KeyStone架构,是目前业界最高性能的量产多核DSP,具有8个1.25 GHz DSP 内核,可在10 W功耗下实现160 GFLOP的性能。TI即将推出极致性能、超低功耗的TMS320TCI6609多核DSP,它4倍于C6678性能,32 W就能实现512 GFLOP的性能。不但可使DSP成为HPC的理想解决方案,而且还正改变着开发人员选择应用解决方案的方式。将于2012年提供样片的TCIC6609代码兼容于C6678 DSP,有助于开发人员重复使用现有软件,保护其对TI 多核DSP 的投资。

    TMS320C6678与TMS320TCI6609非常适合诸如油气勘探、金融建模以及分子动力学等需要超高性能、低功耗以及简单可编程性的计算应用。

助力简化HPC开发

    TI提供功能强大的软件开发工具以及低成本评估板(EVM),还特别提供针对科学计算优化的库,无需花费时间优化代码,便可更便捷地实现最高性能,而且还支持C与OpenMP等标准编程语言,因此开发人员可便捷地移植应用,充分发挥低功耗与高性能优势。在这方面,TI的确下了很大的功夫TI与德州大学奥斯汀分校(UT Austin)成功将该校科学计算高密度线性代数库(libflame 库)移植至TI TMS320C6678多核DSP,该移植可带来所有libflame功能,能够为油气勘探、金融建模以及分子动力学等众多HPC应用提供基本软件构件组块,成为多内核创新的又一里程碑。

此内容为AET网站原创,未经授权禁止转载。