文献标识码: A
DOI:10.16157/j.issn.0258-7998.212108
中文引用格式: 刘雨佶,童峰,陈东升,等. 面向船载远程会议的麦克风阵列高精度DOA估计[J].电子技术应用,2022,48(3):32-36,77.
英文引用格式: Liu Yuji,Tong Feng,Chen Dongsheng,et al. High precision DOA estimation of microphone array for shipboard teleconferencing[J]. Application of Electronic Technique,2022,48(3):32-36,77.
0 引言
船载远程会议系统在船舶智能化方面发挥着显著作用,特别是可提高应急处理能力,推进船岸一体化网络建设。近些年来,船载远程会议监测系统发展迅速[1-3]。麦克风阵列通过提供准确波达方向(Direction Of Arrival,DOA)估计可实现语音增强处理,同时还可以为远程会议系统摄像机提供说话人方位信息,实现多模态交互,已成为远程会议系统的重要语音前端[4-5]。
一般远程会议场所较为理想,因此往往采用较大的麦克风阵列以保证DOA估计,提高语音增强性能和多模态交互效果。但是,船载远程会议所在船舶舱室属于非常典型复杂声学场景。一方面,舱室尺寸狭小,既造成严重混响,也导致无法方便容纳尺寸较大的远程会议麦克风阵列;另一方面,受严重船舶舱室噪声干扰[6],包括由各个舱室有限的空间里集中了非常多的电气设备与发动机等设备造成严重的内部噪声,以及其他舰船噪声、海浪等导致的外部噪声。这些都将使得船舶舱室声学特性变得复杂,对麦阵DOA估计提出了更高的挑战。
近些年,随着人工智能的发展,Xiao等人提出利用多层感知机(Multilayer Perceptron,MLP)来进行DOA估计[7],利用深层网络与大数据来提高DOA估计准确率,远远超过传统DOA估计算法。Diaz-Guerra等人利用带相位变换导向响应功率特征作为特征,建立神经网络模将DOA估计任务转化为回归问题[8]。Nguyen等人使用具有多任务学习功能的2D卷积神经网络从短时空间伪谱鲁棒地估计声源的数量和到达方法[9],这种方法减少了神经网络学习声音类别和方向信息之间不必要的关联,加速模型的收敛。
本文详细内容请下载:http://www.chinaaet.com/resource/share/2000003998。
作者信息:
刘雨佶1,2,3,童 峰1,2,3,陈东升1,2,3,卢荣富4,冯万健4
(1.厦门大学 水声通信与海洋信息技术教育部重点实验室,福建 厦门361002;2.厦门大学 海洋与地球学院,福建 厦门361002;
3.厦门大学深圳研究院,广东 深圳518000;4.厦门亿联网络技术股份有限公司,福建 厦门361000)