文献标识码: A
文章编号: 0258-7998(2015)03-0012-05
0 引言
随着移动互联网、云计算、物联网等的快速发展及视频监控、智能终端、应用商店等的快速普及,移动数据量出现爆炸式增长。数据也在潜移默化地影响着人们的生活,2013年移动用户月均流量:全球529 MB,年增50%;中国139.4 MB,年增42%;预计2020年,全球5.3 GB,中国4.9 GB。淘宝每天交易超过数千万笔,其单日数据产生量超过50 TB。百度每天要处理60亿次搜索请求(谷歌为30亿次),新增800 TB,处理100 PB数据,每天产生1 PB的日志,目前存储网页数达到1万亿,数据总量达到EB级别。2014年6月腾讯QQ月活跃用户8.29亿,微信活跃用户4.38亿,日新增200~300 TB数据量,每月增加10%。截止到2014年6月,中国网民达6.33亿,庞大的网民每时每刻产生大量的数据。在此背景下,大数据时代(Big Data Era)将会面临新的挑战。
一般来说,大数据指的是无法在可容忍的时间内采用传统的IT技术和软硬件工具对其进行感知、获取、处理和服务的数据集合,其特点可以总结为4个V,即Volume(数据量大)、Variety(类型繁多)、Velocity(产生速度极快)和Veracity(数据真实)。学术界、工业界甚至于政府机构都已经开始密切关注大数据问题。《Nature》和《Science》分别在2008年和2011年推出了关于大数据的专刊[1-2],2012年,计算社区联盟发表了报告“Big data computing:Creating revolutionary breakthroughs in commerce,science,and society”[3],旨在阐述数据驱动的背景下,解决大数据问题所需要的技术以及面临的一些挑战。奥巴马政府已把“大数据”上升到国家战略层面,2012年3月美国投资2亿美元启动“大数据研究和发展计划”,借以增强收集海量数据、分析萃取信息的能力[4]。欧盟方面,过去几年已对科学数据基础设施投资1亿多欧元,并将数据信息化基础设施作为Horizon 2020计划的优先领域之一。2012年1月截止的预算为5 000万欧元的FP7 Call 8专门征集针对大数据的研究项目,仍以基础设施为先导[5]。
物联网[6]作为大数据业务的重要组成部分,其技术实现问题关系到大数据问题能否顺利解决。物联网的关键在于实现世界上所有的人和物在任何时间、任何地点,都能方便地实现人到人(Human-to-Human,H2H)、人到物(Human-to-Machine,H2M)、物到物(Machine-to-Machine,M2M)之间的信息交互。因而物联网实际上要解决的是海量无线终端的通信问题。
在移动蜂窝网络是当前主流无线通信网络的环境下,随着物联网、移动互联网等业务的快速发展,移动蜂窝网络由于其具有的移动性支持和广域覆盖等特性,已成为支撑物联网、移动互联网业务有效传输的重要途径。然而传统移动通信网络是针对人与人通信业务设计的,而在物联网通信中,无论是通信数据总量还是无线通信终端设备规模都将空前巨大[7]。以M2M通信为例,据估计未来十年内增加的M2M通信设备将达到240亿~500亿[8,9],其中将有20亿将直接与基站联系。显然,大数据无线传输将会对原有蜂窝网络架构、协议、接入控制、资源分配、反馈机制等[10]带来新的挑战。
1 大数据无线通信面临的挑战
1.1 能量有效问题
现代移动蜂窝网络设计,包括第四代移动通信系统,如:LTE(Long Term Evolution)[11],其服务对象主要是H2H通信,因此其设计的主要关切是如何提供高的频谱利用率和高服务质量等。与传统蜂窝网络注重提高服务质量和高效利用带宽不同,物联网的许多应用环境中难以做到人工干预[12-14],仅仅依靠电池供应能量且电池部署数目庞大,而商品化的电池并不能满足节点持续工作数月甚至数年的需求,这将使得节点极易因能量耗尽而无法工作,尤其体现在小区边缘设备首先能量耗尽,从而造成网络拓扑的变化和网络性能的恶化,最终导致网络分裂和瘫痪。因此,无线终端设备更在意如何以尽可能少的能量上传更多的数据,能量有效问题已成为大数据无线通信系统设计中不可忽略的一个因素[15-17]。
在无线设备的能量消耗中,传输信息所需要的能耗远高于计算所带来的能耗,如文献[18]中的收发信机发送1 bit数据耗能1 μJ,接收1 bit数据耗能0.5 μJ,而处理1条指令耗能8 nJ。随着目前应用需求的不断丰富,对无线传感器网络的能耗要求将更高。如何在网络运行过程中节约能量、最大化网络生命周期,是当前面临的首要挑战。
1.2 大规模接入控制与资源分配
与H2H通信相比,M2M通信具有很多特点:(1)M2M用户设备要远远多于H2H通信;(2)与H2H通信中用户通常具有低速甚至高速移动性不同的是,M2M用户通常具有较低的移动性;(3)大多数M2M上行通信链路都采用小数据包传输(例如,家庭安全和智能计量服务)。M2M通信的这些特性会给传统的蜂窝无线通信系统的接入控制和资源分配带来诸多问题。例如,大量的M2M设备同时发送信息不仅会导致同一小区内随机接入数据包的拥塞问题,还会干扰相邻小区的设备。现有的研究表明[19,20],如果不对大规模接入(Massive Access Control,MAC)和无线资源进行有效管理与控制,大量M2M设备的上行数据量会造成无线资源的严重短缺。因此,为了支持M2M通信,传统的无线通信系统需要一个有效的大规模接入控制和无线资源分配方案。
在M2M/H2H共存的蜂窝网络通信场景中,一方面,时间、频率资源的共享会带来严重的同频干扰,从而大大降低系统性能;另一方面,M2M设备和H2H设备具有不同的服务质量(Quality of Service,QoS)需求。因此,在M2M/H2H共存的蜂窝网络中,如何在确保各种时延敏感业务(如H2H多媒体通信)QoS的前提下进行有效的接入控制和无线资源分配[21]是一个亟需解决的关键问题。传统的资源分配算法主要用来保证H2H通信的吞吐量最大化、时延最小化[22-24],而M2M通信的群组通信、时延可控、延时容忍、低移动性、小数据传输以及低数据速率等特点也给接入控制和无线资源分配提出了新的要求。因此,在设计无线资源分配方案时,需要考虑这两种类型用户共存场景下如何进行有效的资源分配[25]。目前,如何针对大规模的无线设备设计合理的大规模接入控制与资源分配方式,提高网络负载能力,是大数据无线通信面临的重要挑战之一。
1.3 “反馈风暴”问题
在M2M网络中,数据广播通信由于其较高的频谱利用率,通常被应用于固件更新、配置设定等场景中。由于无线链路的随机衰落特性,基站在发送数据包后很难保证全部接收端都能够正确接收。自动重传请求(Automatic Repeat reQuest,ARQ)技术作为一种简单有效的差错控制方式被广泛用于广播通信中,以保证数据广播的可靠性,其基本思想为接收端通过反馈信道请求重发出错的数据包,发送端根据接收到的反馈信息重传数据包,直到达到特定条件则终止重传。目前,主要的HARQ方案包括PSARQ和NARQ。
1.3.1 PSARQ[26]
PSARQ方案要求接收端对接收出错的数据包进行逐包反馈NACK,并且发送端在收到接收端反馈的NACK后,仅对出错的数据包进行重传。在多接收端场景中,不同接收端都对各自没有成功接收的数据包进行反馈,基站在接收到所有接收端的NACK后,在下一个重传阶段内重传没有被全部接收端解码的数据包。经过反复的“接收端反馈—基站重传”过程,接收端接收出错的数据包越来越少,基站通过接收的NACK统计数据包的覆盖率。
1.3.2 NARQ[27]
NARQ方案是在PSARQ的基础上采用网络编码技术改进得到的。在NARQ方案中,每个接收端对所有数据包进行解码并对数据包反馈NACK。基站根据接收到的反馈,获得每个接收端的每个数据包的丢失情况,并用一个数据包传输错误标志矩阵来表示。根据该矩阵,基站设计相应的异或网络编码策略,使得一个网络编码数据包能够尽可能地包含多个原始数据包,并能被大部分接收端解码。
NARQ方案相比于传统的PSARQ方案,可以有效地减小重传数据包的个数,但是直接将其应用于物联网广播通信中,会带来两个问题:一是反馈信息仍然数量较多;二是设计目标为实现100%的用户成功接收,基站重传编码策略会受到每一个接收端接收情况的影响,因而系统性能随着接收端数量的变化而产生较大变化。
面对海量的无线终端,无论是PSARQ还是NARQ方案,其逐包反馈机制会导致“反馈风暴”,从而大大增加系统开销。因此,如何在提高无线数据广播频谱效率的同时降低反馈开销,是大数据无线通信面临的挑战之一。
2 解决思路
2.1 高能效的大数据无线传输
2.1.1 休眠模式
M2M终端设备一般具有4种运行状态,即发送、接收、空闲、休眠。设备正在发送数据或接收数据时,处于通信状态,设备不进行数据收发时就处于空闲状态,但此时也需要消耗能量。设备在休眠时的能耗远小于其他3种状态下的能耗,所以延长设备的休眠时间,使其在没有数据需要发送或转发时进入休眠状态可以取得显著的节能效果。
M2M设备的密度往往比较大,使得一些区域可能被多个设备所覆盖,并且许多应用仅仅需要周期性地进行数据传输,这些特点为利用休眠调度机制节能提供了现实可能性。通过尽可能地关闭这些冗余设备,并使它们轮流工作以平衡网络中的能耗,已成为延长网络寿命的通用做法。但设备休眠时无法对信道进行侦听,状态切换时需要一定的恢复时间与启动能量,所以还需要结合其他应用需求在各个设计指标之间进行合理权衡,如时间延迟、覆盖率[28]等。
2.1.2 功率控制
在M2M设备消耗的所有能量中,通信模块的能耗占了绝大部分,如文献[29]指出,M2M设备的总能耗中通信部分占比达91%,所以在保证网络连接可靠性的前提下减少发射功率能大大减少能量浪费。能量有效的功率控制还能够减少节点间的干扰,实现对资源的最优化利用[30]。但是不同的发射功率会产生不同的拓扑结构,进而对路由协议、数据融合等其他协议造成影响,从而增加系统的复杂度以及硬件的处理能力。目前的研究一般将功率控制与其他节能技术进行联合优化,如与路由协议的结合。鉴于M2M网络的功率控制属于NP-难问题[31],所以一般是采用近似解法或者智能算法。
2.1.3 路由协议
按照M2M设备状态的不同,可以将能量有效路由协议分为两类:节省通信状态下能量消耗的路由协议和节省空闲状态下能量消耗的路由协议[32]。
节省通信状态下能量消耗的路由选择方案研究主要包括两个方面:一方面,寻找源节点到目的节点总体消耗能量最少的路由。具体方法是控制M2M设备的发送功率,使其达到保证正常传输数据分组的最小功率,通过降低路径的总传输功率来节省M2M设备的电池能量,从而达到降低网络总体消耗能量的目的,如果每个M2M设备的发送功率相同,寻找总发送功率最小的路由就成为寻找最小跳数路由。这一类路由协议有MTPR、PARO和COMPOW等。另一方面,尽量使网络中的设备均衡地消耗能量,要求寻找路由时尽量选择剩余能量高的M2M设备参与中继转发,同时避免使用剩余电池能量不足的M2M设备加入路由,避免低电M2M设备因耗尽电池能量退出网络而造成网络分割现象。这一类路由协议有LEAR、EDDSR、MBCR等。
根据M2M网络逻辑结构的不同,还可以将网络路由协议分为平面路由和层次路由两种。由于平面路由缺乏对网络资源的有效管理,反应速度跟不上网络的动态变化,所以目前有关路由的研究以层次路由为主。在层次路由中,网络一般被分为若干个簇(Clustering),每个簇分别由一个簇首(也称为簇头)对其他M2M设备(称为簇成员)进行管理,负责收集它们的数据并进行融合,然后将结果发送给其他簇首[33]。通过这种方式可以减少数据发送的次数以降低网络的能耗,同时也具有良好的扩展性,很好地满足M2M网络的大规模性。如何选择簇首以及在簇首与基站间进行通信是层次路由研究的重点内容[34],其中簇首的选择可能考虑的因素包括节点的剩余能量、节点的地理位置、节点的历史当选信息、所在簇的规模大小等因素,而簇首与基站间通常采取多跳通信的方式,具体的转发策略则不尽相同,如最短距离转发、最小代价转发、多路径等[35]。
2.2 M2M系统的动态资源分配方法
在M2M系统中,传统蜂窝网络给每个用户分配固定时频资源的分配方式,将无法满足大规模用户需求。大数据无线通信对原有蜂窝网络的接入控制和资源分配方式[10]提出了新的挑战。
2.2.1 M2M系统的资源分配方法
文献[36]在现有蜂窝网络的接入控制与资源分配方案的基础上通过建立专用承载的方式进行改进,提出了随机接入请求方案以适应小数据量通信。文献[37]利用“Moveright”[38]算法对TDMA策略进行资源分配优化,发现在业务数据量较小的条件下,平均资源分配的平均能耗值近似于最优化方案的平均能耗。文献[39]提出了一种随机接入CDMA策略和协调连续干扰消除策略,仿真结果验证了在基站负载较小的情况下使用CDMA接入的可行性。
随着多天线技术和连续干扰消除技术等高级信号处理技术的发展,基站处采用多包接收技术日趋成熟,即基站可以对多个设备同时发送的数据包进行正确译码。文献[40]针对基站处采用连续干扰消除技术的上行接入问题,提出了一种基于瞬时信道信息条件的资源分配方法。文献[41]在分析基于导频的正交资源分配与基于用户配对的非正交资源分配方案的折中关系的基础上,提出了一种适用于大规模设备接入的基于用户配对的资源分配方案。文献[42]提出了一种基于周期分簇的能够满足不同QoS需求的M2M系统大规模接入控制方法,有效提高了M2M系统的能量效率和端到端时延,但该方法对无线资源进行正交性划分,因此每个子信道仅能够分配给一个设备。文献[43]针对多小区系统中M2M设备的大规模接入与资源分配问题,提出了一种基于多分组的随机接入与资源分配方法,在有效降低资源消耗总量的同时确保了系统较低的中断概率。
2.2.2 M2M/H2H共存系统的资源分配方法
H2H系统主要关注高频谱效率和高服务质量。M2M的群组通信、时延可控、延时容忍、低移动性、小数据传输等特点对系统的服务质量提出了新的要求。如何在M2M/H2H共存的系统中实现资源的有效分配是保证系统性能的关键所在。
针对时延受限条件下M2M/H2H共存的LTE系统的资源分配问题,文献[25]提出了一种能量有效的无线资源分配方法,在确保了不同类型设备QoS性能的同时,有效降低了总的发送能量消耗。文献[11]研究了M2M/H2H共存的LTE系统中的无线资源分配问题,给出了不同应用需求下的无线资源分配策略,提高了系统的可达速率性能。文献[21]提出了一种统计QoS保障条件下能量有效的无线资源分配方法,有效提高了M2M/H2H共存的LTE系统的能量效率和QoS满意度。
2.2.3 基于设备休眠的动态资源分配方法
针对蜂窝网络中大量无线终端设备多址接入时资源分配问题。根据M2M通信随机业务量大的特点,可以利用贪婪思想,结合智能丢包[44]的方法,以换取更多靠近基站的终端设备接入,从而实现负载增益的最大化。仿真结果表明,FDMA资源分配方式能够带来更多设备接入,而TDMA分配方式增益效果更明显。在容许休眠的情况下,可以采用基站集中式的动态资源分配策略。在每次上传数据时都让剩余能量较少的几个设备进入休眠模式,避免了一个设备耗尽能量时其他设备剩余大量能量造成能量利用率低下的问题。通过仿真发现在FDMA和TDMA资源分配方式中,分别使用平均功率最小和最小-最大法可以延长网络寿命。为了降低基站因为集中式资源分配中的复杂优化运算带来的复杂度,终端设备引入分布式机会上传策略,各设备根据概率随机通信,能够有效提高TDMA方式中的网络寿命。
2.3 基于部分反馈的有限集合网络编码自动重传请求
针对大规模接收端数据广播时面临的“反馈风暴”问题,本文提出了一种有限集合网络编码自动重传请求(Finite set Network coding Automatic Repeat reQuest,FNARQ)方案。通过设计逐轮反馈机制,在保证减小每个数据包平均传输次数的前提下,有效降低海量无线终端数据广播系统的反馈负载,并利用有限集合网络编码进一步降低数据包平均传输次数。
与需要根据反馈信息动态确定编码方式,并且满足每一个接收端需求的NARQ方案不同,FNARQ考虑的是大多数接收端的需求,它需要在发送端和接收端处预置有限个数的网络编码方案,每次重传根据所有接收端的反馈信息从有限编码方案集合中选择一种最有利用于大多数接收端解码的方案对原始数据包进行编码。FNARQ方案的过程描述如下:
(1)基站广播数据包。
(2)用户对接收到的数据包进行译码,通过数据包尾部的CRC校验判断是否正确译码。若接收到的是原始数据包,则直接解码即可;若接收到的是网络编码数据包,则通过在包头处的信息获知采用的是何种预置网络编码方案,利用已经解码的原始数据包对网络编码数据包进行解码。
(3)完成一轮解码后,若正确译码全部原始数据包,则进入静默状态;反之则根据原始数据包的解码情况计算全部预置网络编码方案能够带来的解码增益,通过反馈信道回传能带来最大解码增益的网络编码方案序号。
(4)基站根据接收到的反馈信息数量确定覆盖率,若超过一定比例(大于用户数量的CR)则广播结束信息,广播结束;反之则根据反馈信息确定采用的网络编码方案,发送网络编码数据包。
(5)重复步骤(2)~(4),直到广播结束。
与传统的PSARQ和NARQ方案相比较,有限集合自动反馈重传方案,一方面极大地降低了反馈信息数量,同时,另一方面也提高了广播通信的效率。
3 结束语
在移动蜂窝网络是当前主流无线通信网络的环境下,随着物联网、移动互联网等业务的快速发展,移动蜂窝网络由于其具有的移动性支持和广域覆盖等特性,已成为支撑物联网、移动互联网业务有效传输的重要途径。本文分析了传统蜂窝网络承载大数据通信时面临的能量有效、大规模接入控制和资源分配以及“反馈风暴”等挑战,研究了大规模无线终端环境下,高能效的大数据无线传输、M2M系统的动态资源分配、基于部分反馈的有限集合网络编码自动重传请求等方法,为改善大数据无线通信网络性能提供了思路。
参考文献
[1] Nature.BigData[DB/OL].[2014-11-27].http://www.nature.com/news/specials/bigdata/index.html.
[2] Science.Special online collection;Dealing with data[DB/OL].[2014-11-27].http://www.sciencemag.org/site/special/data.
[3] BRYANT R E,KATZ R H.Big-Data computing:Creating revolutionary break through sincommerce,science,andsociety[DB/OL].[2014-11-2].http://www.cra.org/ccc/docs/init/Big_Data.pdf.
[4] Tom Kalil.Big Data is a BigDeal[DB/OL].(2012-03-29)[2014-11-27].http://www.whitehouse.gov/blog/2012/03big-data-big-deal.
[5] Big Data[R].ERCIM News.2012(89).
[6] International Telecommunication Union.Internet reports 2005:the Internet of Things[R].Geneva:ITU,2005.
[7] Ericsson.More than 50 billion connected devices[R].2011.
[8] GHOSH A,ZHANG J,ANDREWS J G,et al.Fundamentals of LTE[M].Prentice-Hall,2010.
[9] QUEK T,DARDARI D,WIN M.Energy efficiency of dense wireless sensor networks: to cooperate or not to cooperate[J].IEEE Journal on Selected Areas in Communications,2007,25(2):459-470.
[10] CHAO H,CHEN Y,WU J.Power saving for machine to machine communications in cellular networks[C].Proc.201IEEE Globecom Workshops,389-393.
[11] ZHENG K,HU F,WANG W,et al.Radio resource alloca-tion in LTE-advanced cellular networks with M2M com-munications[J].IEEE Communications Magazine,2012,50(7):184-192.
[12] Chih-Hua Chang,Hung-Yun Hsieh.Not every bit counts:a resource allocation problem for data gathering in ma-chine-to-machine communications[C].Proc.IEEE Globe-com,2012.
[13] CHEN Y,WANG W.Machine-to-machine communication in LTE-A[C].Proc.2010 IEEE Veh.Technology Confer-ence,2010.
[14] ZHAO C,PERILLO M,HEINZELMAN W B.Generalnetwork lifetime and cost models for evaluating sensor network deployment strategies[J].IEEE Transactions on Mobile Computing,2008,7(4):484-497.