新兴的无线连接技术促使更多产品向新一代商务及家庭网络应用方向发展。因此,网络市场中的用户终端设备(CPE:customer premises equipment)部分,也正朝着消费市场的状态转变。
CPE产品的成功,需要由一个设计平台及灵活的产品开发流程来支撑,以满足各种新兴网络协议的性能需求,加快研发进程,最终提供经济而节能的终端产品。
图1网络市场中设备数量分布
技术发展动力
对网络设备而言,日益增长的带宽需求是最为显著的技术发展动力。曾有人指出带宽正以类似于摩尔定律的方式增长,如:客户端的带宽每18-24个月增加一倍,而核心/光纤带宽约每8月增长一倍[2]。
然而,日益增长的带宽需求并不是唯一促进技术发展的原因。对CPE的功能及智能性需求的增长也是另一种驱动因素,因此,单单采用更大更快的处理器并不是最为有效的方案。
更多功能的集成、增强的安全性和多种协议的发展等都将使CPE产品越来越复杂。不同协议的交换处理是众多CPE应用产品的普遍需求。如:无线局域网接口设备中的核心功能是在以太网和多种IEEE802.11接口标准间进行转换。产品需求中可能会需要接口设备能够提供多种接入点,以支持管理多种格式数据流的需求。
即使网络产品不是便携式的,低功耗也非常重要。低功耗设计可以降低对外壳及印刷电路板(PCB)制造的限制,也无需电扇散热。除去了这些问题,设计的可靠也将大大提高。
图2将各类产品集中使用的思路促使应用产品往集成化方向发展
为了达到优良的实时性能,处理器应能有效地管理中断,并同时具备足够的数据处理能力。上下文的切换也是关键的需求,具有在中断服务程序和任务模式编码之间有效切换的能力会带来更佳的性能。当然,还应尽量减少中断服务和进行上下文切换的延时。
这类产品中的存储器管理是个需要仔细考虑的问题。完全的嵌入式系统通常运行在固定的程序集中,无需加入新的程序。这样的应用产品并不需要带有地址转换的完整存储器管理单元(MMU)。更简单的存储器保护单元(MPU)通常可以高效地运行实时操作系统(RTOS),允许多程序运行,进行上下文切换时开销更少。含有 MMU的内核进行中断服务时可能比基于MPU的内核要低效一些,同时还需要为地址转换设置更大的外部存储器。
CPE产品正朝着家用消费品市场进军。目前,市场竞争激烈,终端设备的价格便成为主要的竞争优势。同样地,缩短产品上市时间,也是提高市场占有率的重要优势。客制化终端网络设备将真正缩短推出系列产品的上市时间。市场需要一种既能节约开发费用,又能缩短研发时间,并且能简便地开发系列产品的技术方案。
无论从商务或技术角度出发考察一个片上系统,都需要处理器方案能满足多种网络应中的特殊控制和信号处理需求。设计的技术需求表明,若处理器性能远远高于实际需求,即设计了太多不需要的功能,意味着将无端地增加产品成本;但一定的性能冗余和灵活性可以支持产品的后续发展,而无需进行更本性的重新设计。
总结上述两个驱动因素,开发人员应能够从技术和商业两方面来衡量实现一个具体设备。
ARM在网络设备中的应用
为了增加带宽并拥有更复杂的协议数据交换能力,许多设计人员正考虑在设计中使用双核。
CPE系统需要满足多重的复杂控制需求。许多系统体系结构建立于单内核基础上,管理高级别的功能,如进行系统配置操作和运行实时操作系统,而后与专用的状态机集成,进行如数据包处理等操作。然而,这样做使得设计和调试非常复杂,特别是设计含有多重私有状态机时。
嵌入式软件技术方案相较于复杂的私有硬件技术方案更易维护和推广运用。嵌入式软件技术方案能使用高级语言进行编程,使用众所周知的程序员模式,并拥有大量具有丰富经验的工程师作为后盾。
ASIC的集成度已经非常高,因而,CPU内核的面积非常小。用第二个或第三个处理器来代替以往用多重的独立硬件模块显得更加经济和实际。
在此种趋势的推动下,ARM推出了集成了双ARM946E-S微处理器内核的PrimeXsys双内核平台(946DCP)。
ARM946E-S特点
ARM946E-S内含有ARM9E-S?内核,为运行实时操作系统的嵌入式产品提供指令(I)、数据(D)高速缓存、紧密耦合存储器(TCM)、写缓冲器、存储器保护单元(MPU)。指令和数据缓存和TCM缓存都是可配置的。存储器体系结构令设计者可依据实际情况调整缓存和TCM大小。
ARM9E-S微处理体系结构提供了快速中断响应和上下文切换功能。该体系结构非常合适用于如Wind River的VxWorks或Mentor Graphics Nucleus等小型实时操作系统(RTOS),非常适合于CPE设计。增强型DSP指令集可直接在CPU内核上运行,满足一些DSP需求,不需要另外一个独立的DSP处理器。
EDN嵌入式微 处理器基准协会(EEMBC,www.eembc.org)提供了一套完整的嵌入式处理器测试标准。EEMBC Netmark?网络基准是一套路由测试标准。其包含开路最短路径第一(OSPF/Dijkstra)算法,数据包流路由基准,路
由表算法等。该基准对处理器在网络运用时实现的功能进行了模拟。
这套测试基准中包含压缩的路由测试基准,用实际的IP帧结构执行数据打包和路由表查询。该基准可使用不止一个长度的路由表,因而更为高效。这避免了合成测试基准中单一尺寸路由表的缺陷。ARM为ARM946E-S内核提供Netmark基准。在与ARM签订了NDA之后,您可获得该基准。
PrimeXsys双核平台
PrimeXsys双核平台(图3)提供了可扩展、预集成的基础级IP,支持RTOS的直接运行。946 DCP采用多层AMBA?片上总线体系结构,在交叉型AHB总线矩阵中支持多重总线管理,并提供非常高的带宽。在946DCP中添加IP,可以用主、从方式访问系统总线。相应地,AMBA外设总线(APB)为速度较慢的外设提供了更节能的片上系统连接方式。
每个内核内都含有向量中断控制器(VIC)和嵌入式跟踪宏单元(ETM?)。当内核全速工作时,ETM监控ARM指令和数据总线,在与跟踪调试工具进行数据交换前,将数据暂存到MultiTrace?分析器中。
表1为946 DCP中IP主要模块的性能指标。
表1. 双核平台模块门数(单位:千门)
半导体合作伙伴或系统集成商在946 DCP基础上可进行自身产品的开发,非常简便,各公司可根据各种不同的需求制造各种产品。为硬件与其它IP集成提供多种总线主、从端口,PrimeXsys平台负责处理软硬件开发过程。ARM的PrimeCell库中还包括了其他外设许多外设IP。
PrimeXsys平台的另一个关键价值为:在CPU内核之上设立了新的IP标准,使第三方合作伙伴可以为PrimeXsys平台提供不同的软、硬件IP技术方案。
PrimeXsys技术基础(图3)提供了子系统级设计,包括CPU内核和其他预集成的部件,为开发特殊应用平台提供稳定的基础设计。预集成部件至少应使内核具有装载操作系统的能力。在以双核技术为基础的情况下,在预集成模块中添加逻辑功能,是实现如内核通信和调试等功能的必须条件。在其它基础部件中综合其他功能,适于创建子系统体系结构,无需将该基础部件建为特殊用途的产品。
与硬件子系统相同,技术基础包括子系统的软件部分--并不只是指预移植的操作系统,也指驱动程序和软件库(对于特殊硬件模块在基础部件中的驱动非常必要)。
ARM PrimeXsys技术基础将作为特殊应用的PrimeXsys平台技术方案基础。
双核平台刺激第三方公司开发软硬件IP、提供如TCP/IP等功能(通过软件协议堆栈)、安全处理如编/解码运算法则、提供关键技术方案和许多其他应用软件。
图3. ARM PrimeXsys 946双核平台
双核性能
决定系统性能的一些主要的参数包括CPU性能、存储器带宽、系统总线带宽、中断响应延时等。
PrimeXsys双核平台体系结构可为多种CPE产品提供充足的存储带宽。表2所示为946 DCP的存储带宽情况。
表2:PrimeXsys 946 DCP存储带宽。
*表2假设:
32位SDRAM
AHB存取模式--70%读、30%写
所有存取以字进行
50%为四次触发,30%为八次触发,20%为16次触发
存储器存取:
50% bank open, correct page
30% bank closed
20% bank open, incorrect page
表3. 应用产品带宽需求。
*表3条件:
平均带宽采用PCMCIA和USB接口,或Ethernet和USB接口,并不需要并口。
应用产品带宽需求如表3所述,提供了CPE接口的评估值。例如:存取点在802.11上,PCMCIA/USB1v1 转接口需要21.5MB/s的峰值带宽,以太网和USB2v0接口需要平台提供至少为92MB/s的峰值存储带宽。
PrimeXsys开发
PrimeXsys平台的目的是为了将预集成的IP优势发挥到极至。系统公司若要最大限度地体现平台的价值,就必须提供在平台上又快又准确地建立其他技术方案的方法。为了达到此上目的,PrimeXsys系统,包括其他一些测试基准,将保证开发进程非常快速,并能最终开发出高质量的设计产品。
AMBA的各项测试基准将确保把IP加载到AMBA总线的同时可完全连接并符合AMBA片上总线标准。测试基准,通常基于Verisity的测试基准自动控制语言E,迅速自动生成功能测试、数据检测、功能覆盖分析、HDL仿真控制。PrimeXsys测试基准提供系统集成和系统确认。
同时也 提供软件开发模型(SDM)。该开发模型包括:内核的指令集模拟器(ISS)、运行在ARMulator?测试环境下的附加IP模型(C语言)。虽然此种模式可运行RTOS,但模拟速度限制了ARMulator在实际应用产品测试时的速度。该环境对于验证寄存器的完整性、驱动初始化和操作系统移植具有非常大的意义。
为了进一步加快系统对基于FPGA的开发板的仿真速度,在得到硅芯原型前应提供应用开发和测试的环境。
调试多核系统
对于应用产品来说,获得双核体系结构具有非凡的意义,但是,对许多设计人员来说,调试双核系统仍将遇到许多难题。
无论何时,RTOS将执行若干线程。典型的应用产品将执行许多任务,如:编解码、数据包处理等。若系统管理两个通道,这将导致有一、两个任务同时运行,可能在同核上,也可能在异核上。因此,RTOS可能在两个核之间切换运行。
无论系统配置如何,成功的调试便是在各个阶段都能跟踪编码执行情况,从开始执行任务,到发生中断、上下文切换、数据处理。以不同的独立调试系统调试独立运行在不同核上的编码是非常困难的。
PrimeXsys 946 DCP提供了针对复杂的多线程应用软件进行联合调
试的方法。946 DCP可在由多源(包括双核、附加的IP等)产生的断点处进行交叉触发。设计者可使用触发器设置触发点和单步运行,调试非常简单,就如同在调试一个单核系统。ARM RealView多核调试器结合了一个仿真器和一个调试器,可对ARM的多核系统进行内核的同步调试。
小结
CPE产品中的片上系统应具有优异的性能和低功耗特性,并能快速上市且开发费用低廉。CPE产品只有具有上述特性,产品才能获得成功。ARM的PrimeXsys双核平台将能缩短产品上市时间、降低投资风险、带来更具竞争力的片上系统技术方案基础平台。
通过类似于ARM体系结构的方法,把PrimeXsys平台建立为业界标准,将使ARM的合作伙伴们通过与ARM的合作关系受益,同时可以从第三方持续获得各类创新的软、硬件IP。