亞馬遜和谷歌等大公司先后推出智能家居中樞產品,并且都選擇了智能音響作為切入點,推進人工智能落地的戰略。這方面已經有很多文章涉及。 這一次,我們從比較專業的聲學麥克風陣列的角度對比一下這二者的高下,進而引出生態布局的思考。
在剛剛過去的Google秋季發布會上,谷歌正式推出了Google Home智能音箱。Google Home將自己的兩大技術Google Now(智能語音系統)與最新版本的Google Assistant(智能服務平臺)結合打造出的智能音箱。
Google Home作為谷歌最為看重的智能中控出生,并采用了雙麥克風的硬件配置, 售價定為129美元。
眾所周知,2014年亞馬遜推出了第一款智能音箱Amazon Echo,從推出起至今已熱銷超過400萬臺,儼然成為了最新一代的科技寵兒。據悉,蘋果也即將推出 Siri 智能音箱。各大巨頭和創業企業,紛紛看中智能家居中控這塊“肥肉”,由此也拉開了人工智能領域新一輪戰役的序幕。
Google Home和Amazon Echo都代表了行業巨頭通過智能WiFi音箱為入口,推進人工智能落地的戰略。這方面已經有很多文章涉及。 這一次,我們從比較專業的聲學麥克風陣列的角度對比一下這二者的高下,進而引出生態布局的思考。
雙麥克 vs 多麥克陣列 技術上各有高下
談及Google Home的硬件配置,不難發現它和Amazon Echo相比有一個最大的差異,那就是少用了5個麥克風。Amazon Echo采用的是環形6+1麥克風陣列,而Google Home只采用了2麥克風陣列。
Amazon Echo采用6+1麥克風陣列
麥克風陣列是什么呢?就是放置在空間中不同位置的多個麥克風。根據聲波傳導理論,利用多個麥克風收集到的信號可以將某一方向傳來的聲音增強或抑制。利用這種方法,麥克風陣列可以將噪聲環境中特定聲音信號有效的增強。由于麥克風陣列技術具有很好的抑制噪聲和語音增強的能力,又不需要麥克風時刻指向聲源方向,因此在語音處理領域具有非常好前景,可以用在非常廣的應用領域。
根據麥克風數量不同,麥克風陣列具有不同的特點。行業采用的以雙麥克居多,比如幾乎所有中高端手機都采用雙麥克降噪技術來提升通話效果。四麥克、六麥克、八麥克線性陣列和環形陣列在行業內也有應用,但還遠遠達不到雙麥克應用的數量級。
首先,雙麥克和多麥克陣列的一個重要區別,是成本的不同。顯然,雙麥克的成本相對多麥克低得多,除了可以直觀觀察到的麥克風數量不同之外,為了支持多麥克通道而必須具備的硬件電路、為了處理更多的信號數據而額外需要的計算能力,都使得成本體現較大的差異。所以我們看到兩者的售價體現的極為明顯,Google Home為129美元,AmazonEcho售價為179.99美元,差價約50美元。值得注意的是,這兩家的硬件產品的戰略沒有多大區別,都是硬件基本不賺錢。
其次,雙麥克和多麥克的技術路線區別較大。雙麥克和多麥克采用的技術路線雖然有類似之處,但算法體系存在較大區別。顯然,麥克風越多越容易實現更好的降噪和語音增強效果,所以為了達到同樣或者類似的效果,雙麥克陣列技術相對多麥克陣列的技術挑戰性更高。但因為成本問題,采用雙麥克陣列的技術挑戰雖然大,但從應用普及的角度上卻是大勢所趨。
另外,從效果上看,如果技術優化足夠好,在3~5米的家庭環境中,雙麥克陣列雖然可以和多麥克陣列做到幾乎一樣的降噪和語音增強效果。但雙麥克有個缺點,就是聲源定位只能定位180°內的范圍,而環形麥克風陣列(不管是4Mic、6Mic還是8Mic)都可以做到360°全角度范圍內的定位。所以Google Home只能有四個LED燈來顯示狀態,而Amazon Echo可以用LED燈顯示說話人的方向。當然,這個差別僅對具有聲源定位需求的產品存在影響,而且對一些本來就需要靠墻擺放的設備如空調、電視機等是沒有任何問題的。而對于類似機器人等擺放在室內中央的產品,如果希望它能定位說話人位置,那就只能采用多麥克方案了。
最后,從產品的角度,雙麥克方案簡單更易落地。多麥克陣列最大的問題是,無論線性陣列還是環形陣列,其對產品的外觀、結構設計都有極為嚴苛的要求,因為麥克風是要求必須在空間上均勻分布的。而雙麥克顯然就不必考慮這些因素。
基于雙麥克陣列的產品生態構建更具優勢
麥克風陣列作為實現智能語音的必備硬件,可以說是人工智能感知的硬件基礎。因此,麥克風陣列的布局,將深深影響人工智能產品的生態布局。
首先,眾所周知的是,谷歌是以生態見長的公司。比如,Android構建了整個移動互聯網的生態基礎。在谷歌從移動互聯網向AI轉型的時候,提出了“AI First”的口號,并推出了開源深度學習系統TensorFlow,這個系統被認為是人工智能領域的Android。
那么,谷歌為什么在如此重視AI戰略的時候,推出這款Google Home的智能家居產品,并且采用雙麥克的方案呢?相信對于谷歌這樣的公司,成本和技術絕不會是阻礙他們采用更好技術的原因。
據業內人士分析,最關鍵的就是上面提到的廣泛的適用性和落地的便捷性,可能讓谷歌最后選擇了雙麥克方案。谷歌布局整個智能硬件產業鏈,而非只打造一款爆款產品。現在做Google Home智能音響,以后也可能做電視、汽車等等,所以在軟硬件選擇上都會考慮更通用、更長遠的方案。多麥克陣列對外觀和結構的嚴苛要求,使得該方案的應用場景極為有限,不具備廣泛的適用性,以Google的遠大抱負,顯然會選擇適應性更強的雙麥克方案。
目前,谷歌明確表示會部分開放對接的子系統,包括燈控、溫控器、開關三大類,媒體分析,谷歌隨后還會提供針對家庭第三方設備的免費軟件開發包,以方便鼓勵第三方開發商增加新的服務功能,提升Google Home的兼容性。以對抗出貨量400萬臺的Echo營造的生態體系,因為Echo對接的名單已經是很長一大串,其中就包括了Nest。
雙麥克陣列在智能家居領域落地最為廣泛
雖然多麥克陣列方案在業內炒的如火如荼,但在落地過程中,雙麥克方案卻成為家電產業中出貨量最大的方案。據了解,目前國內主流家電廠商應用語音交互技術的產品中,包括樂視電視、海信電視、格力空調、美的空調、華帝煙機等,出貨量最大的產品搭載的都是雙麥克方案。
另外,國內的主流人工智能企業也都在雙麥克方案上重點布局。據悉,僅云知聲一家企業,目前搭載雙麥克的芯片模組每月的出貨量就超過幾萬片,而科大訊飛目前也在緊鑼密鼓研發雙麥克方案,爭奪智能家居市場。
據家電行業資深技術人士介紹,從2012年開始行業內就開始尋求語音交互技術應用在家電產品中,并明確要求:第一、用戶直接通過語音方式控制產品,且不受產品自身噪聲影響;第二、一定距離的遠場語音交互得以實現;第三、方案成熟,成本控制。遠場語音交互是關鍵中的關鍵。當時市場上普遍解決方案都是八個麥克風收音,雖然語音識別準度得以提高;但實施成本、結構難度、生產安裝等問題卻接踵而來。但像空調、電視這類家電產品,它永遠都是貼墻放,八個麥克風在實際應用上是多余的。雙麥克技術在任何產品上均可自然適配。
該人士稱,雙麥克風陣列的結構簡單,成本低、容易實施、功耗低等特點讓它更容易在家電產品中實現落地。相信在未來一段時間內,雙麥克都將成為智能家居產品中的主流配置。
不同應用場景下自由配置
雖然雙麥克有性價比和結構簡單的種種優勢,但并不能完全覆蓋所有場景下的產品需求。
比如,在機器人領域里,對聲源定位的要求比較高,所以一般都會使用環形多麥克方案。這兩年國內比較火的Rokid機器人就采用了8麥克的陣列。
未來人工智能領域還需要更多適配的硬件,以滿足不同智能產品的需求。因此,國內像科大訊飛、云知聲等行業領軍企業都相繼推出了6+1麥克、4麥克陣列方案,滿足智能音響、機器人領域的產品需求。
從長遠來看,麥克風陣列解決的只是感知這一塊,更快的落地(雙麥克更有優勢) 、更多種的形態(雙麥克和多麥克陣列可配置),是建設人工智能生態的第一步。
|