文獻標識碼: A
DOI:10.16157/j.issn.0258-7998.212108
中文引用格式: 劉雨佶,童峰,陳東升,等. 面向船載遠程會議的麥克風陣列高精度DOA估計[J].電子技術應用,2022,48(3):32-36,77.
英文引用格式: Liu Yuji,Tong Feng,Chen Dongsheng,et al. High precision DOA estimation of microphone array for shipboard teleconferencing[J]. Application of Electronic Technique,2022,48(3):32-36,77.
0 引言
船載遠程會議系統在船舶智能化方面發揮著顯著作用,特別是可提高應急處理能力,推進船岸一體化網絡建設。近些年來,船載遠程會議監測系統發展迅速[1-3]。麥克風陣列通過提供準確波達方向(Direction Of Arrival,DOA)估計可實現語音增強處理,同時還可以為遠程會議系統攝像機提供說話人方位信息,實現多模態交互,已成為遠程會議系統的重要語音前端[4-5]。
一般遠程會議場所較為理想,因此往往采用較大的麥克風陣列以保證DOA估計,提高語音增強性能和多模態交互效果。但是,船載遠程會議所在船舶艙室屬于非常典型復雜聲學場景。一方面,艙室尺寸狹小,既造成嚴重混響,也導致無法方便容納尺寸較大的遠程會議麥克風陣列;另一方面,受嚴重船舶艙室噪聲干擾[6],包括由各個艙室有限的空間里集中了非常多的電氣設備與發動機等設備造成嚴重的內部噪聲,以及其他艦船噪聲、海浪等導致的外部噪聲。這些都將使得船舶艙室聲學特性變得復雜,對麥陣DOA估計提出了更高的挑戰。
近些年,隨著人工智能的發展,Xiao等人提出利用多層感知機(Multilayer Perceptron,MLP)來進行DOA估計[7],利用深層網絡與大數據來提高DOA估計準確率,遠遠超過傳統DOA估計算法。Diaz-Guerra等人利用帶相位變換導向響應功率特征作為特征,建立神經網絡模將DOA估計任務轉化為回歸問題[8]。Nguyen等人使用具有多任務學習功能的2D卷積神經網絡從短時空間偽譜魯棒地估計聲源的數量和到達方法[9],這種方法減少了神經網絡學習聲音類別和方向信息之間不必要的關聯,加速模型的收斂。
本文詳細內容請下載:http://www.rjjo.cn/resource/share/2000003998。
作者信息:
劉雨佶1,2,3,童 峰1,2,3,陳東升1,2,3,盧榮富4,馮萬健4
(1.廈門大學 水聲通信與海洋信息技術教育部重點實驗室,福建 廈門361002;2.廈門大學 海洋與地球學院,福建 廈門361002;
3.廈門大學深圳研究院,廣東 深圳518000;4.廈門億聯網絡技術股份有限公司,福建 廈門361000)