技术背景
随着视音频编解码技术的提高,各种基于互联网络的远程音视频交互迅速普及,音频采集、编解码、传输等技术得到较快的发展和进步,各种音频编解码标准和网络传输纠错技术也都有成熟的应用。但是,在现有技术中,网络带宽依然是大多数网络流媒体交互应用的瓶颈。因为在许多应用场合中,网络带宽的实时稳定性根本无法得到保证。由于网络带宽不足或者带宽不稳定,经过编解码压缩后的音频信息可能无法完整的传输给接收方,或造成通信中断,更有甚者,常会因为音频传递质量差而导致信息的接收方误判传递信息,从而造成更大损失。
基于上述问题,业界目前的做法是借助其他的手段,例如邮件传递、拷贝等,将音频信息发送给接收方,这样不但降低了工作效率,而且大大增加了信息交互的时间成本。鉴于以上所述现有技术的缺点,华平创造性的推出了一种音频信息网络数字化实时传输技术,以解决现有技术中存在的因网络带宽不足、不稳定,丢包率比较高,致使接收方无法完整接收到音频信息的问题。
技术介绍
音频信息网络数字化实时传输技术,应用于具有至少一个音频信息发送端及一个音频信息接收端的网络架构中。该技术系统包括以下十个模块:1、音频信息输入模块,用于采集音频信息;2、信息源缓存模块,用于缓存接收到的音频信息源;3、编码模块,用于将音频信息源编码为音频包;4、网络传输模块,用于将音频包通过网络传输至音频信息接收端,还用以将音频识别模块输出的文字信息传送至文字显示模块;5、检测模块,用于实时检测网络传输模块,将音频包传输给音频信息接收端时的丢包率,当检测到丢包率大于丢包率阀值时,发出音频识别指令;6、音频识别模块,用于接收音频识别指令,并将提取的音频信息源识别为文字信息;7、文字转音频识别模块,用于接收文字信息,并将该文字信息识别为音频信息;8、音频信息输出模块,用于输出接收到的音频信息;9、解码模块,用于将音频包进行解码为音频信息;10、文字显示模块,用于将文字信息转换为文字字幕予以显示。
音频信息网络数字化实时传输过程图
音频信息传输过程:首先在音频信息发送端设置一个丢包率阀值,使用音频信息输入模块采集音频信息,将采集的音频信息作为信息源缓存到信息源缓存模块,同时使用编码模块将信息源编码为音频包,通过网络传输模块传输至音频信息接收端,在传输过程中由检测模块实时检测传输时的丢包率,当丢包率大于预设的丢包率阀值时,发出音频识别指令,音频识别模块根据接收到的音频识别指令提取缓存的音频信息源,并将音频信息源识别为文字信息经由网络传输至音频信息接收端,音频信息接收端再将该文字信息识别为音频信息输出(也可根据客户需求,将音频信息接收端接收到的文字信息直接转换为文字字幕显示);若实时检测的丢包率不大于预设的丢包率阀值,音频信息接收端会将接收到的音频包直接解码为音频信息输出。
技术特点
1、可保证音频信息的完整传输:本技术主要是将音频信息在发送端通过预设丢包率阀值来判断网络带宽是否稳定,能否满足音频传输需求,并根据实际情况设置音频传输方式,保证在各种网络情况下的音频信息完整传输。
2、灵活的输出方式:在某些特殊应用中,例如不便接收声音的场合,或者接收信息的场合声音过于嘈杂,可直接将语音转成文字输出。
技术应用
低带宽、高丢包率的成功应用
本技术被广泛应用于远程视频会议、远程监控指挥、视频教学等应用场景中。解决了现有技术中存在的因网络带宽不足或不稳定,丢包率高等原因,造成对方无法完整接收到音频信息的问题,保证了音频信息在各种复杂网络情况下的完整传输。