作者:严斌峰 张智江 张范
随着现代通信技术的发展,移动多媒体通信已成为新的业务需求。其中移动多媒体可视电话型业务由于实现了音频、视频、数据(文本、图文等)等多种媒体的综合处理,使不同地点的用户之间可以进行实时音视频通信,而越来越为人们所关注。根据3G移动网络的实际发展情况,开展可视电话业务的条件已经具备,香港和黄已经推出WCDMAWCDMA电路域可视电话业务、韩国SKT推出了EV-DO分组域可视电话业务。
1、WCDMA/TD-SCDMA电路域可视电话
移动可视电话业务在WCDMA/TD-SCDMA电路交换无线网络上提供实时视频、音频或数据等媒体格式的任意组合,主要是利用WCDMA/TD-SCDMA网络在移动设备上实现可视电话的无线互通,从而让移动用户之间能够随时随地进行实时音、视频等的交互。现阶段可能只限于移动终端之间的互通,将来可能还会扩展到移动终端与PSTN、ISDN等各种网络设备的互通。
在WCDMA/TD-SCDMA系统中,由于目前的可视电话业务是作为电路域的一种承载业务来实现的,因此,在RDI/UDI模式下,速率仅能达到56kb/s/64kb/s。较低的传输速率影响了它对音频及视频编解
码协议的选择,决定了移动可视电话系统不可能采用大速率的编码方法。
1.1 业务功能
可视电话应包括以下模块:视频输入输出及编解码模块、音频输入输出及编解码模块、用户数据应用功能模块、复用功能模块、系统控制模块等。各模块的作用分别如下:
◆视频输入输出及编解码模块:将输入的视频流数据根据特定的协议进行编解码。将采集自摄像头等视频输入设备的数据进行编码,压缩成适合在低速条件下传输的码率;同时,将H.223解复用层分解出的视频数据进行解码,然后,传输到相应的视频处理设备,进行显示或其它处理。用于WCDMA/TD- SCDMA电路域可视电话业务的视频编码协议主要有H.263和MPEG-4。
◆音频输入输出及编解码模块:此模块的主要作用是将输入的音频数据进行编解码。将来自麦克风等音频采集设备的音频信号进行编码压缩,然后,将编码后的流数据传输到H.223的AL2层。同时将H.223解复用模块解出的音频数据进行解码,并将解码的数据传输到相应的声音处理设备,如听筒、扬声器等。用于WCDMA/TD-SCDMA电路域可视电话业务的音频编码协议主要有AMR及G723.1。
◆用户数据应用功能模块:典型的用户数据应用是T.120。这个协议支持包括数据和图像传送的多点数据会议,另外,如共享白板和应用等数据应用也可以实现。
◆复用功能模块:将被编码后的逻辑信道表示的视频码流、音频码流、数据信息及控制信息等复用成单一的输出码流,并将收到的码流分解成各种多媒体码流,用于WCDMA/TD-SCDMA电路域可视电话业务的复用协议采用ITU-T的H.223协议。
◆系统控制模块:主要是保证可视电话连接的正常建立、释放及提供可视电话会话过程中的信息控制,如终端间的主从决定、能力交换、逻辑信道的打开与关闭等。WCDMA/TD-SCDMA电路域可视电话业务中采用ITU-T H.245作为控制协议。
具体各个模块的在整个系统的中位置及整个WCDMA/TD-SCDMA电路域可视电话系统的构成如图1所示:
图1 WCDMA/TD-SCDMA电路域可视电话系统功能结构示意图
1.2 业务模型
下面以两个WCDMA/TD-SCDMA电路域可视电话终端都在PLMN覆盖域之内为例,简单介绍可视电话业务的业务模型。可视电话业务是作为电路域的一种承载业务来实现的。两个选择了可视电话业务模式的手机通过发端UTRAN、GSTN以及收端UTRAN建立起CS连接,可视电话业务数据在 3G-324M终端之间进行透明传输。业务模型如图2所示:
图2 WCDMA/TD-SCDMA电路域可视电话业务模型
1.3 音视频复用
移动可视电话系统的复用协议采用H.223复用协议。H.223规定以逻辑信道的方式处理各种媒体信息。
H.223协议的主要任务是负责逻辑信道的适配与复用。H.223的协议结构图如图3所示,它由2层协议组成,即AL层(适配层)和MUX层(复用层)。H.223的复用层并不承担差错控制(除了头信息中的CRCCRC校验),每个逻辑信道的差错控制由H.223的适配层进行,它可以采用不同的差错控制技术,包括但不仅仅限于误码检测和遇错重传方式。
图3 H.223的协议结构
1.4 控制协议
WCDMA/TD-SCDMA电路域可视电话系统所使用的控制协议与H.324系统所使用的控制协议相同,即应符合H.245协议。
H.245是一个普遍适用于基于分组复用的多媒体通信控制协议。H.245协议的主要内容包括终端间的主从决定、能力交换、双向逻辑信道信令、单向逻辑信道信令、回程延迟决定、链路维护、打开和关闭逻辑信道、语音图像和数据通信模式优选请求、H.223复用表表项的传输、流量控制、通用命令和指示等。
◆通信控制协议结构
在H.324协议中定义了两种传送多媒体系统控制PDU消息的方式:编号的简单重传协议帧(NSRP,Numbered Simple Retransmission Protocol)和调制解调器链路接入过程(LAPM,Link Access Procedure for Modem)。在NSRP方式中,每个NSRP命令帧必须接到NSRP确认响应帧后才能发送下一个NSRP帧。在LAPM/V42方式中,在接收到第一帧的确认之前的数据可以用数据串的方式进行发送。所有的H.324终端必须支持NSRP方式,利用NSRP作为在通信初始化过程中H.245的链路层协议。而LAMP/V42方式是可选项,对那些功能要求较高的终端可以考虑采用这种协议。
H.245可以向系统控制部分提供多种服务。传送层的NSRP(或LAPM/V42)为H.245形成的消息流提供差错控制功能,保证 H.245的消息准确无误的传输。H.245的下层是H.223复用协议,它将H.245的控制流和其它信息流复用成一个单一的物理数据流。
H.324中的通信控制信道的数据协议之间的关系如图4所示:
图4 控制信道数据协议结构
◆控制逻辑信道
H.245的信息都必须在逻辑信道O(LCNO)中传输。LCNO在通信开始建立时即被打开,而且在通信的过程中一直不关闭。
H.324的视频、语音和数据信息的传送都是通过逻辑信道来完成的,在控制逻辑信道上按H.245规定的程序,使用“打开逻辑信道”和“关闭逻辑信道”消息来实现逻辑信道的打开和关闭。当一条逻辑信道被打开时,“逻辑信道打开”消息完整地描述该逻辑信道的内容,如所传输媒体的类型、使用的算法、 H.223适配层和各种选项等。逻辑信道在不需要时可以被关闭。
◆控制过程
H.245使用标准描述语言SDL(Specification and Description Language)来定义控制过程不同通信能力的控制,H.245共涉及到10种通信能力。这些控制过程主要完成的任务诸如“主从终端决定”功能、“终端能力交换”功能、“逻辑信道信令”功能、收端到发端的“传输模式请求”功能等。
2、基于IMS
分组域可视电话的业务功能与电路域的基本相同。分组域可视电话业务实现的难点是:分组域服务质量的保证;呼叫控制与承载分离的控制。
2.1 分组域可视电话实现的难点
(1)服务质量
服务质量体现于多个层面。在传送层上服务质量主要体现在时延、抖动、误码率以及倒换时间等;在承载层上服务质量体现在IP包的时延、抖动、丢包率等;在业务层上服务质量针对不同业务有不同的体现:电话业务体现在接通率以及话音质量;VoDVoD体现在图像质量;浏览业务体现在相应的速度等。传送层服务质量取决于器件、传输距离以及设备等,当前已经基本被认可。业务层的服务质量一部分取决于业务控制节点,另外一部分取决于承载层的服务质量。
(2)呼叫控制与承载分离的控制
分组域可视电话业务系统在技术上由控制平面和用户平面构成,控制平面负责为用户建立理可视电话呼叫,并对呼叫进行管理。而用户平面则负责传输可视电话终端之间的视频和音频信息等。
◆控制平面在传输层使用UDP或TCP协议作为传输协议。
◆用户平面在传输层使用UDP协议作为传输协议。
控制平面在应用层使用SIP协议作为控制协议,SIP协议以其简单性和可扩展性,应用越来越广泛。在控制平面上主要传输对传输速率要求较低但对丢包有严格要求的控制流信息。
用户平面则在UDP之上使用RTP协议作为视频和音频的传输协议,RTP协议不采用复杂的传输控制手段和纠错机制,而是采用尽量少的控制与鉴别功能,能满足实时通信的要求。在用户平面上要求满足以下两种传输需求:
◆对传输速率要求较低但对时延和抖动有严格要求的音频流信息。
◆对传输速率要求较高且对时延和抖动要求较高的视频流信息。
分组域可视电话业务系统的协议结构如图5所示。
图5 分组域可视电话协议结构
2.2 基于IMS的可视电话系统的实现
下面介绍基于SIP的IMS可视电话业务实现方法。
(1)IMS的QoS机制
IMS是提供实时和非实时的IP多媒体业务的通用体系结构,由于不限定下层接入技术等特点,它在固定、移动网络融合的过程中受到广泛关注。为了保证移动域IMS的QoS,RFC3312定义了在SIP会话建立过程中进行QoS资源预留的机制。
◆媒体协商和前提
媒体协商和对前提的处理是IMS中两个密切相关的概念。在IMS中,两个UE之间是通过媒体协商就会话中使用的媒体组合以及使用哪种编码方式达成一致。为了两个UE之间能相互协商,人们使用了SDP提供/应答机制,该机制允许UE推迟SIP会话建立的完成,直到双方都成功完成资源预留。这里对所有连接到IMS的UE都强制要求支持SIP和SDP的扩展。
在一般情况下,SIP仅交换一次提供/应答之后就开始建立媒体连接了。但在IMS中,由于双方的UE都必须准备接收所选择的任何编码类型,所以如果在第一次SDP应答中对任何媒体包提供一种以上的编码方案,那么就会产生第二次提供/应答的交互,为每种媒体流选择唯一的编码方案。否则需要在空中接口上按照较高带宽的编码方案预留资源,对于无线资源将是一种浪费。
◆IMS中的资源预留与SDP前提/应答机制
建立媒体PDP上下文的过程称为资源预留。对于双方的UE而言,建立PDP上下文的执行过程是相互独立的。这意味着在资源被成功预留之前,根本无法保证所协商的媒体会话是否可以建立起来。因此,在确认本地和主叫侧的资源预留都已成功之前,被叫侧不
|
应振铃。
为了做到这一点,双方的UE在SDP提供/应答的协商过程中彼此交换前提(precondition)。这些前提主要用于指示:当主叫UE处的资源预留成功后,要把一个SIP UPDATE请求发往被叫UE;被叫UE在未收到来自对方的SIP UPDATE请求同时自己也未成功地完成资源预留之前不应振铃。此外,前提还指示当某个特定的媒体流无法成功进行资源预留时应该如何处理。
◆IMS会话建立中的QoS资源预留实例
QoS资源预留的完成过程如下:
第一次SDP提供/应答交互:主叫UE在发往被叫UE的第一个INVITE请求中提供了媒体类型,并用前提特定的指示对消息进行了扩展。被叫用户在支持前提机制的情况下对收到的第一个SDP提供给出了一个183(会话进行中)答复,答复中包含了自身的前提。
第二次SDP提供/应答的交互(开始资源预留):第二次SDP提供包含在主叫终端发送的PRACK请求中,用来声明最终选择的媒体类型和编码方案。在明确了双方媒体流QoS要求以及媒体流编码方案的前提下,主叫UE开始进行资源预留。这里要注意的是,当遇到商定的媒体和编码的QoS要求不同的情况时,主叫UE需要对预留的资源进行变更。第二次SDP应答包含在被叫UE已回送的200(ok)中,此时被叫UE已开始进行资源预留了。
资源预留成功完成:主被叫的UE都开始进行资源预留以后,任何一方的UE都可能比对方先完成资源预留。无论哪种情况,被叫终端都必须在确定双方都完成资源预留的前提下才能向主叫发送振铃消息,即被叫方在完成资源预留的同时还要等待接收主叫方的确认消息。
主叫方一旦完成资源预留,就会发送一个SIPUPDATE请求给被叫方进行确认,请求中包含了第三次SDP提供,对预留资源的情况加以说明。被叫方完成了资源预留后,又收到主叫方发来的UPDATE请求,此时被叫UE可以确定双方都已成功完成资源预留,因此被叫终端发出了包含第三次SDP应答信息的200(ok)响应。
由此可见,所有资源预留状态都已经达到了所要求的状态,对前提的协商已经完成。一旦双方都预留了资源,两个UE之间就可以进行媒体交换了。此时被叫方确认双方都已经预留了足够的资源收发音频流,于是立即开始振铃,同时对INVITE请求发出180(振铃)响应。
(2)简化IMS分组可视电话系统结构
图6以CDMA分组承载网为例,介绍一种简化的IMS分组域可视电话业务系统结构。
图6 一种简化的CDMA分组域IMS可视电话系统结构
其中,各网络单元的功能如下:
◆AAA:负责对用户进行鉴权,并负责将用户的QoS信息通过PDSN授权给无线接入网。AAA同时负责对用户进行分组承载层的计费。
◆I-CSCF:负责为用户确定S-CSCF,转发SIP请求及响应消息。在用户与其他网络的可视电话进行互通时,I-CSCF确定对方用户的I-CSCF或确定所应使用的互通网关。
◆P-CSCF:P-CSCF是终端在可视电话系统中的第一个接触点,其地址通过P-CSCF发现机制获得。在用户注册时,P-CSCF根据用户的归属域选择I/S-CSCF并转发SIP消息,P-CSCF会保存注册用户的相关信息(如公共用户识别符、UE地址、路径信息等),其中的路径信息用于该用户后续发起呼叫时直接使用转发SIP消息。P-CSCF具有计费功能。完成SIP消息压缩解压缩功能。
◆S-CSCF:负责记录用户的呼叫状态,完成呼叫控制功能。
◆PDSN:负责为用户终端建立分组数据会话。
◆RAN:负责为用户提供无线传输承载。
◆MS:移动终端包含视频和音频编解码器负责多媒体信息的处理,同时具有SIP用户代理功能以与其他用户进行通信。
◆HSS:为S-CSCF提供可视电话业务层面的鉴权矢量,并提供业务层面的授权和计费等功能。根据网络的实际情况,HSS和AAA可考虑合设。
◆互通网关:在用户与其他网络的可视电话进行互通时,用于处理相关的会话控制信息和进行媒体及协议的转换等。