微控制器是将微型计算机的主要部分集成在一个芯片上的单芯片微型计算机。微控制器诞生于20世纪70年代中期,经过20多年的发展,其成本越来越低,而性能越来越强大,这使其应用已经无处不在,遍及各个领域。例如电机控制、条码阅读器/扫描器、消费类电子、游戏设备、电话、HVAC、楼宇安全与门禁控制、工业控制与自动化和白色家电(洗衣机、微波炉)等。
现今的嵌入式工业及汽车系统中,有许多是基于8位或16位微控制器架构来设计的。随着新的低功耗32位架构的面市,这些应用有可能获得更高的性能、准确度和功效。此外,处理能力的提高也有助于实现新产品的差异性功能,包括先进的控制算法,GUI显示器、语音控制,以及电容式触摸感测等下一代接口。8 bit/16 bit微控制器通常需要消耗很多计算资源来做这些工作。今天,内置浮点运算的强大微控制器开始出现,32 bit微控制器有足够的能力来实现其中的许多功能。
评估微控制器的性能
相比于专业的DSP处理器,微控制器用于信号处理具有如下优势:
(1)有效的循环控制;(2)丰富的外设;(3)单一的处理器结构、指令集和开发工具链;(4)统一的中断和任务切换环境,同类存储器;(5)同样的操作系统同时管理控制和信号处理任务,基于MMU;(6)由于大大地简化了开发过程,所以上市时间较短;(7)流行的微控制器容易获得,开发工具成本低。
如何评估微控制器的性能是否满足应用需求,是工程师在项目设计的早期阶段需要考虑的问题。评价和汇总来自数据手册的信息是一种有效方法,另一种方法是使用某一类型的评估板来进行特定性能测试和功耗测试的方法。这两类方法都有各自的缺点。
32位与8/16位系统的效率差异相当大,在16位处理器上,一次普通的32位乘/累加操作需要4次乘法与4次加法运算。由于需要访问存储器以存储中间结果或释放多个寄存器,执行效率会进一步降低,并可能减慢其他操作的速度。因此,在16处理器上,一次32位乘法可能需要20~40个周期。而32位UC3C处理器只需要单个周期即可。此外,32位管线较宽,故从存储器检索数据及指令的速度更快。
在评估过程中,使用了三个步骤:(1)通过运行各种系统测试基准,并改变不同的系统参数,抽象出系统特征;(2)解释收集的特征数据来确立系统的行为;(3)通过系统的行为决定怎样设定控制参数,从而使系统表现达到预想的效果。
特征化
从理论上来说,性能测试是对运作系统式样的质化或量化评估。在实际应用中,系统的式样可能不够详细,不足以定义完整的质量测试,创建测试也许太昂贵,不能保证其开发。一个比较好的得到系统特征的折衷方法是,使用测试基准作为一个或一系列以软件执行的测试,提供量化的数据,这些数据可以用来比较不同系统的特性。
为得到微控制器的特性,从EEMBC的Auto-Bench组选择一套性能测试基准。这些基准帮助预测微控制器在汽车电子,工业和一般应用中的性能。运行每一个基准测试都通过多次反复循环以消除一些启动代码在每次测试开始时只运行一次的影响。使用这一工业标准基准组件的一个优势就是可以将结果数据与其他类似架构微控制器的测试数据进行比较,以评判总体系统性能。
这里所测试的微控制器是基于ARM926EJ-S内核,带硬件矢量浮点协处理器和一个32 KB的指令缓存(I-cache)。该测试衡量浮点协处理器和指令缓存的性能。在微控制器不同的工作频率时运行Auto-Bench测试基准,使用Energy-Bench测量每一基准执行中消耗的能量。Energy-Bench是另一个EEMBC工具,可以测量基准负载运行时处理器消耗的能量。从Energy-Bench收集的数据可以观察到微控制器在各种不同负载下的能量效率。选择了这些工具来评估微控制器,下一步就是确定微控制器在不同运行条件下的性能。
性能分析
为了分析微控制器的性能,需要决定在不同条件下的整体系统响应。在测试项目中,需要评估恩智浦微控制器上浮点协处理器和指令缓存的性能。
运行Auto-bench基准测试组,改变4个参数:运行频率、CPU核的电压、指令缓存的状态和浮点协处理器的状态。
Auto-Bench/Energy-Bench测试环境系统由三部分组成:数据获取系统(DAC)、软件开发环境和测试目标。美国国家仪器公司的DAC连接到PC机上,PC机运行Energy-Bench这一功耗和能耗测试软件。软件测试环境使用KeilTM集成开发工具来编译,下载和运行Auto-Bench测试基准。把供给微处理器的三个电源电压隔离开,Energy-Bench可以测量Auto-Bench基准测试中消耗的能量,并计算在每一测试中消耗的总能量。
在4种不同的频率下运行Auto-Bench(13 MHz、52 MHz、104 MHz和208 MHz),并组合其他测试条件,包括打开或关闭浮点协处理器,打开或关闭指令缓存。浮点协处理器默认为不使能的,使得编译器对任何需要浮点运算的情况使用软件浮点。
实际收集到的数据远比本文中所能呈现的多,这里只介绍两个有代表性的案例以表现收集的特征数据怎样决定系统的性能。图1以图形方式表示了EEMBC的有限脉冲响应滤波(FIR)的测试数据结果。在13 MHz运行两个不同的基准测试,在0.9 V~1.2 V之间改变CPU核的电压。当测试基准运行在CPU时钟设置为208 MHz时,AHB的时钟设置为其极限104 MHz.在所有其他测试频率中,CPU时钟和AHB时钟是相同的。
图1EEMBC的有限脉冲响应滤波(FIR)测试数据结果
浮点运算就是实数运算,因为计算机只能存储整数,所以实数都是约数,这样浮点运算是很慢的而且会有误差。现在大多数机器都是32位的,也就是说32位都用来表示整数的话,那么对于无符号整数就是0 到 2^32-1,对于有符号的话就是-2^31 到 2^31-1.
首先来看指令缓存的性能,观察图1标示着循环次数/s的图。数据表明,在所有频率下,当指令缓存使能时,微控制器的绝对性能都更好。第二,当CPU时钟频率增加时,即使指令缓存提供了更好的绝对性能,其提高的相对幅度不是线性的。通过观察标示着循环次数/s/MHz的图,读者可以验证这一特性。图2表明,对于几乎所有的CPU时钟频率性能都线性增加大约100次/s/MHz,而除了运行在208 MHz时,根据指令缓存使能与否,性能降至60或80次/s/MHz。
很明显,当指令缓存使能时,系统运行更快。因为当CPU从指令缓存执行指令时,对AHB RAM进行读写的次数减少。
非线性性能特征是由于AHB时钟具有最高104 MHz的上限的结果。当AHB时钟慢于CPU时钟时,CPU必须等待较长的时间以从AHB总线的RAM上读取指令,其结果是每MHz相对性能的增加较小。
下面分析一下指令缓存对能耗的影响。如果只考虑图2中功率(Power)的绝对功耗,也许会得出关闭指令缓存可以节省整个系统能量的结论。然而,Energy-Bench数据表明,当指令缓存被使能时,每一个基准循环消耗的能量实际上是低于指令缓存被关闭时的。
更详细地对能量(Energy)图进行观察表明,当指令缓存使能,在208 MHz,1.2 V时每个循环消耗的能量甚至低于其他运行频率。实际上,有10%~12%的提高。换句话说,在使能指令缓存的情况下执行同样的基准,高速(208 MHz)运行较短的一段时间比低速(52 MHz或104 MHz)运行较长时间具有更好的能量效率。
从循环次数/s的图可以看到使用浮点协处理器的运行效率和能耗。这张图相当生动地表明了集成的浮点协处理器的性能效果。在频率为208 MHz时,使能指令缓存,使用软件浮点运算,微控制器运行在大约8 500次/s;而使用浮点协处理器,这一值越至超过32 500次/s,性能提高超过280 %.
检验浮点协处理器的能耗效果参见图3中的能量图。当指令缓存使能、使用软件浮点运算时,每个基准负载在208 MHz的能量表明微控制器消耗每次循环大约16 J; 而使用浮点协处理器时,这一值小于4 J/循环-节省超过75%的能量,而工作量是相同的。
图1循环次数/s图表明,在频率为13 MHz、供电电压为0.9 V和1.2 V时,性能基准数据是相等的。
然而,功率图表示,在1.2 V时的功耗比0.9 V时的功耗要高大约75%.
系统控制参数
在测试例子中,使用的EEMBC特性工具决定目标测试系统中指令缓存和浮点协处理器的性能。根据这一性能,可以选择通用的配置参数,以提供具有低能耗的系统性能的最好条件。
下面是一些参数选择,在类似那些EEMBC Auto-Bench基准测试组的环境下,可以控制系统的功率利用率和性能:
(1)使能指令缓存能使性能更好;
(2)使用硬件浮点协处理器比软件浮点的运算性能明显提高且能耗明显降低;
(3)在208 MHz时,指令缓存使能,其能耗比低频率时要好;
(4)对于13 MHz低功耗运行,内核电压在0.9 V时比1.2 V时要好得多。
除以上这些总体概要外,更重要的事实是,根据工业标准的性能和能量基准测试得到的数据,确定了系统的性能。而这些基准可以公开得到,并可得到独立权威的验证。
使用EEMBC Auto-Bench基准和Energy-Bench基准,可以得到一致的性能分析,很容易演示给其他人。而且,可以被重复、验证。
设计嵌入式系统通常是一项很有挑战性的任务,几乎每一个嵌入式系统都有相对唯一的硬件配置。对于特定的嵌入式操作系统,经常需要重写特定的代码。对此通常还有非常严格的能耗限制。本文给出了量化的科学测试方法以帮助嵌入式工程师考虑如何选择适合于特定应用的控制器来构建系统。即使所测试的嵌入式系统差异很大,确凿的数据仍可以帮助系统评估者比较相同的性能特征。
在本文的测试设置中,使用了EEMBC的特性工具来决定恩智浦微控制器的性能。然后使用这些性能信息为特定的运行环境选择最好的控制参数。该测试例程量化了评估系统中使用微控制器的指令缓存和浮点协处理器的系统性能。收集到的特征数据方便定义系统行为,并提供一种方法学来选择运行参数以控制系统性能和能量消耗。
测试结果表明,硬件向量浮点运算单元的使用可以使系统性能提高5倍左右,并可减少代码量,降低功耗。
硬件浮点协处理器VFP9是NXP基于ARM926EJ-S内核的LPC3000系列的特征,NXP低功耗的90 nm工艺技术可以以非常小的芯片面积和极小的功耗实现这一功能,使得LPC3000 ARM9微控制器非常适合需要进行信号处理的医疗电子等行业应用。