什么是麥克風陣列
麥克風陣列是由一定數目的麥克風組成,對聲場的空間特性進行采樣并濾波的系統。
目前常用的麥克風陣列可以按布局形狀分為:線性陣列,平面陣列,以及立體陣列。其幾何構型是按設計已知,所有麥克風的頻率響應一致,麥克風的采樣時鐘也是同步的。
麥克風陣列的作用
麥克風陣列一般用于:
聲源定位,包括角度和距離的測量
抑制背景噪聲、干擾、混響、回聲
信號提取
信號分離
聲源定位技術
利用麥克風陣列計算聲源距離陣列的角度和距離,實現對目標聲源的跟蹤。
基于TDOA(Time Difference Of Arrival,到達時間差)的聲源定位技術。估計信號到達兩兩麥克風之間的時間差,從而得到聲源位置坐標的方程組。然后求解方程組即可得到聲源的精確方位坐標。
信號的提取與分離
通過波束形成技術,在期望方向上有效地形成一個波束,僅拾取波束內的信號,從而達到同時提取聲源和抑制噪聲的目的。
語音去混響
混響(Reverberation)是指聲波在室內傳播時,被墻壁、天花板、地板等障礙物形成反射聲,并和直達聲形成疊加的現象。
混響的作用
混響是聲學中最重要的現象之一
合適的混響會使得聲音圓潤動聽、富有感染力。
混響時間太長會使得聲音含糊不清,聽不清楚。
混響是建筑聲學中要重點考慮的問題
演講廳要短一些的混響時間,比如北京學術報告廳混響時間為1s
交響樂則需要長一些的混響時間,比如上海音樂廳混響時間為1.5s,維也納音樂廳為2.05s
過大的混響會帶來音素的交疊掩蔽現象,嚴重影響語音識別效果,尤其是遠距離語音識別。
目前主流采用麥克風陣列+深度學習的方式來進行去混響。
線性麥克風陣列
加性麥克風陣列( Additive Microphone Array)
陣列的輸出是各陣元的加權和
最優波束方向可調
結構簡單、方便布局
適用于車載、家電等場合
差分麥克風陣列( Differential Microphone Array )
陣列的輸出是兩兩麥克風之間的加權相減
最優波束方向只能在末端方向
適用于耳機通話等場合
平面麥克風陣列
平面麥克風陣列(Planar Microphone Array )
實現平面360度等效拾音
麥克風個數越多,空間劃分越精細,語音增強和降噪效果越好
廣泛用于智能音箱和交互機器人上
立體麥克風陣列
立體陣列麥克風(3-D Microphone Array )
真正實現全空間360度無損拾音
解決了平面陣高俯仰角信號響應差的問題
麥克風陣列發展趨勢
多傳感器的融合。聲學麥克風,光學麥克風,骨傳導麥克風的多模態降噪。提高信噪比,以及適應不同的環境。
分布式麥克風陣列。客廳,臥室,廚房,餐廳,手持各類麥克風的數據實時融合處理。在更大范圍內實現真正的全方位拾音。
基于深度學習的麥克風陣列。用多麥克風+神經網絡,來取代雙耳結構+大腦信號處理機制。
最終目標:達到人類聽力水平;用兩個麥克風讓機器能聽清10米-20米的聲音;實現雞尾酒會效應。
本地和云端識別緊耦合,配合使用也是一個大的趨勢。
|