您的位置: >> 首頁 → 行業資訊 → 企業訪談 → 對話塞賓科技CEO張德明 體驗聲學科技魅力 |
對話塞賓科技CEO張德明 體驗聲學科技魅力 每個人對聲音的感知都不一樣,有人單純感受聽覺舒適,有人聽的細枝末節,還有人聽的是技術層面。很多人帶著對聲音的滿腔熱愛,奔赴聲學領域專注研發,為音頻設備相關問題提供更優質的解決方案。塞賓科技CEO張德明博士作為聲音重度愛好者,一直在聲學領域不斷研發創新,且有著極大建樹,帶來了很多非常成熟的產品。近日,張德明博士受邀作為京津冀之聲科創中國欄目的嘉賓,與廣大聽眾分享他與聲音的故事,以下節選自部分采訪內容。 主持人:我先跟各位聽眾朋友說一下,其實在我們節目正式播出之前,我已經和張總聊了好長時間了,今天張總帶來了很多設備,有話筒有耳機,就讓我非常的興奮,因為我很喜歡這些聲音設備,今天看到您在這個聲音設備的硬件的領域已經打造出了這么多非常棒,而且用我的角度來說是很神奇的產品,真的是讓我耳目一新。所以我們先跟各位聽眾朋友分享一下,張總您自己的創業公司平常究竟是做什么的? 張博:我們有做很多的硬件,這些產品是大家平時能夠用眼睛看到的東西,因為是有形的東西。但實際上塞賓真正做的事情是這些有形產品背后在芯片級里面的這些通訊的技術,通訊的算法。具體我可以給大家打一個比方,我們這些麥克風在采集一些聲音,類似于模擬我們人耳的鼓膜,接收到聲音,然后把信號經過一定的處理。比如把里面的噪聲給濾除,把一些別的音樂還可以跟聲音來進行混合,再進行一些音效的處理,然后還可以把它進行編碼。因為我們現在的社會都是要進行一些數字的傳輸,這樣處理這個事情的整個鏈路會變得更加有效率,然后再進行無線信道的一個傳輸。什么叫無線信道?我們以前對于聲音的系統,從麥克風到我們的錄音機,再到我們的Daw的系統,就數字音頻的系統,很多的這種連接都是基于有線的。那么塞賓做了除了算法之外的另外一件事情,就是要把所有的這些音頻的連接線給剪掉,變成無線。無線會給人們的工作生活或者娛樂等各種跟音頻相關的事情,帶來極大的便利。 主持人:無線其實大家不陌生了,我們現在很多朋友戴的耳機就是無線的,您現在做的事情跟大家司空見慣的現象之間到底有什么關系? 張博:大家接觸到的這些耳機,我們先講麥克風好了,我們在KTV里也有遇到手持的K歌麥克風,我們叫 u段的麥克風。相對來說 u段的麥克風跟我們現在跟移動手機上的無線不是一回事,它是400兆到900兆左右中間任選一個頻段。所以這樣的麥克風相對來說它的功耗也是比較高的,而且沒有辦法跟手機這樣的移動設備來進行工作,因為它不適用這樣的一種移動場景。 大家現在的耳機也是一樣的,考慮到這種超低功耗,無線耳機它主要以聆聽為主。所以這些耳機你想讓它來采集很好的聲音,比如說打電話、開會,是不能夠期望它有很好的聲音的。目前全球的藍牙體系的聲音采集最多只能做到7000赫茲單通道的聲音,并且即便是7000赫茲的聲音,也是經過了非常大的失真,丟失了很多細節的聲音。 而塞賓在做的一件事情是基于無線藍牙設備可以實現CD級的聲音的采集,也就是說人聽見的聽不見的,20千赫茲附近一直到低頻的20赫茲全部都能采集下來,然后做降噪做編碼,分享給遠程的人。 主持人:中間這些技術的難點,這些門檻都是怎么跨過的? 張博:其實很多方面有我們不同的研究者,在不同的領域深深的扎根,做持續的研究。在音頻的算法方面,我們也有很多相應的積累,比如降噪。我們現在看到市面上絕大多數耳機的降噪,是降了1000赫茲以下的環境噪聲,讓你的耳腔里面形成一個非常小的安靜環境,它跟我們通信講的降噪是兩回事。這是第一種降噪,第二種降噪就是我剛才跟您分享的一段音頻也是一樣的,傳統的藍牙只能傳輸7000赫茲以下的聲音。所以他們把7000赫茲叫上行降噪,有的地方叫enc環境降噪。塞賓是做出了全球第一個片上全頻的和CD級的 HIFI降噪技術。 主持人:您的意思是指在人耳聽到的范圍當中都可以降噪。 張博:對,都可以降噪,并且保持人聲極大的還原度。而我們聽到的其它真無線的耳機,它們可以用來打電話、開會等,因為無線方便。但它采集回來的聲音只能是7000赫茲以下的,這種失真是非常大的。而我們可以實現高品質的全頻帶CD級的聲音采集,并且要把全頻帶里的噪音去除。 主持人:這里面有個問題,聲音在人耳聽出來,有的是美妙的,有的是噪聲。可是讓一個硬件設備讓一個話筒聽,它可聽不出來什么是好聽的什么是噪聲。 張博:我們有算法去分辨哪些是噪聲,哪些不是噪聲,我們的處理方法跟其他耳機處理還是不太一樣的。其它耳機把佩戴者本身的說話聲當成有用信號,把其他的所有信息都變成是干擾和噪聲全部壓制掉,寧可對佩戴者自己的聲音形成一些損傷,也要把一切外面的聲音干擾統統干掉,所以你能聽到一個聲音,幾乎聽不到外面干擾的聲音,但是人的聲音已經非常明顯的變形了。 但我們對于聲音的理解不太一樣,我們從物理上到算法上模擬到數字上,通過各方面的技術,實現對人聲極大的保留,并且對于背景噪音背景干擾極大的抑制。但是如果是全景聲,比如需要一些非常自然的類似于同期聲的時候,我們就不能對背景里一些聲音進行過分的抑制。對一些比如風扇的聲音,汽車發動機的聲音,拍照的聲音、風照的聲音,這些我們在統計上評估上能夠研究出來,他們一般情況下不會作為有益的聲源,需要把它抑制掉。但是如果采集一個街道,比如南鑼鼓巷,你從里面走過,這時候錄音就一個干巴巴的聲音,旁邊鏡頭里能看到別人叫賣的聲音卻聽不到,讓人感覺非常不舒服不自然。我們需要把叫賣的聲音也錄下來,雖然他聲音的量級非常小,我們需要很保真。但是對于比如空調的聲音,我們還是需要進行一定的壓制,所以我們在頻譜在識別的時候,要進行模態上的分類,需要在什么場景下保留什么樣的聲音。 我們的第二代全景聲的產品,就有全景模式、樂隊模式、solo模式和音樂模式。在不同的場景下,所針對的主聲源是不一樣的,這時候我們就為用戶設計好了,在這種場景下怎么樣才能夠保護你的主要聲源,讓一些次要被聲源壓制掉,而不是像傳統藍牙耳機一刀切。 主持人:簡單粗暴的方式肯定是不好的,但您剛才講到這一點我覺得很好奇,這個得要求工程師除了在算法的層面能夠有很很好的技術以外,其實還需要他對于生活有理解,有各種想象,哪些東西其實是人真的愿意關注的聲音,哪一些可能有沒有都無所謂,哪一些是必須要去掉的。 張博:因為有很多的聲源,每一個聲源多么好聽也好,多么有特點也好,當聲源越來越多的時候,麥克風采集到的信號本身會越來越趨近于一個噪聲化的東西。 主持人:這個和人耳是不一樣,因為我們聲音是通過大腦的處理,把聲音進行了某種程度上的優化。 張博:我們的耳朵、耳廓、肩膀、頭,到骨膜里面有耳蝸系統纖毛系統的感知,再到里面的感受處理,大腦對雙耳的處理能夠實現雙耳對空間任何一個聲源的聚焦,然后把其他的聲源能夠屏蔽掉,這個是麥克風實現不了的事情。所以我們當時創業做的第一個事情,就是模擬人類的雙耳自然環境自然生長的感受,能夠實現人真正的雙耳聽覺的傳遞。比如我在現場能夠聽到上下左右前后遠近各種各樣的聲音,它的定位,它生產的感受是怎樣,然后把這種信號進行降噪,進行編碼傳輸,到另外一個地方再把它呈現出來。這樣就可以實現身臨其境的體驗。 主持人:我跟大家舉個例子,剛才張總說的這個是什么意思?比如說戴耳機聽音樂,其實你聽到的這個音樂哪怕說它的保真度很好,但是這個聲音只是從你的左耳朵和右耳朵分別進去,即便是有立體聲,也就是一些生產向位的變化,所謂的向位就是可能大提琴在左邊,低音鼓在右邊,但要是用了這種模擬人耳的方式來去聽的話,你會發現這個聲音除了是左耳和右耳之外,在你的前面后面左上右上等等各個方向其實都會有聲音,就像是一個人或者一個樂隊在繞著你。但是說到這一點我就很好奇,到底是什么原因讓您決定要在聲音設備或者打造一種前所未有的聲音場的賽道上去進行創業? 張博:這里面其實有很多的原因,第一個原因就是我作為一個通信行業的從業者,有一些深入的思考,我們怎么樣解決通信的終極體驗,實現千里之外身臨其境的體驗傳輸,這是我們希望能夠做到的事情。從移動互聯網的層面來看,我們其實很容易在PC到PC實現這種聲場,比較容易。但是我們發現PC互聯網作為互聯網的第一代,其實到2010年,基本上就進入了移動互聯網第二代通訊,這種移動互聯網是以手機作為介入終端做通訊終端。科技會讓人越來越隨心所欲,但這時候如果通訊系統只能綁定在固定的房間,把人限制在某個特定的地方進行某種特殊的這種活動的話,不符合人們發展的期望和訴求。對于這種科技,一定是要無線化、移動化,要非常方便使用。我們做的這套通訊系統,目前依然處于第二代移動互聯網發展的平臺期,也就是說我們很多的事情還是基于手機來進行的,這個時候跟移動手機進行配合,做這樣的通訊體驗傳輸,是最便利的環境。這也是為什么近幾年對于音頻設備的需求,會像井噴一樣發展起來了。 主持人:我看到像塞賓科技這幾年的成長非常好,除了您之外很多做音頻硬件,做耳機做相關配件的企業,大大小小發展的都不錯,為什么現在大家賣這些東西生意這么好。 張博:說明大家對聲音的表達會越來越重視。以前在互聯網上表達一樣的信息,有寫博客寫文章,到后來大家發圖片,再到現在發視頻。但視頻里面很重要的一點就是聲音,因為如果視頻聲音不好,會給人的體驗造成非常大的一種損失。為了讓視頻具有傳播力,顯得更專業,很多人會采用一些稍微專業的設備。對于播客而言,相對于以前的專業的播音主持,體量非常大,因為它沒有過多的門檻要求,任何一個人都可以隨時隨地開一個直播的口子,哪怕只有一個人或者是沒有人為自己鼓掌喝彩。這是一個全民直播的時代,這個時代大家更注重自己向世界傳遞信息,而不只是去聆聽世界,這是個趨勢性的問題。我們順應這個趨勢來研發無線化更加便利化的設備,這應該也是順應潮流的需求。 主持人:您也看到了這些社會的變化,包括潛在的需求,所以您是決定來創業。而且創業方向就是我們剛才提到的,首先它要無線,第二是盡可能的方便,第三是要最大限度的還原真實的狀態。 張博:之前講傳統的,無論是做電影還是做音樂,像這些過程我都或多或少參與過。所謂的pgc或者專業內容制作團隊,這里面會有好幾個層面的事情。大家認為所謂的專業,就是藝術家,其實不是的,以前唱歌的人或者主持人或者演員,他們是Artist是藝術家,他們是不負責來做這些內容操作的。他們有專業的團隊,有錄音師、調音師、混音師等一些專業的人。還有專業的設備,像錄音棚里專業的麥克風,專業的Daw系統,這些非常昂貴,不是普通人用的,操作這些專業設備比我們操作手機要復雜得多。pgc的p就是professional,這些各種操作的專業人就叫professional。 但是到了移動互聯網時代,其實我們手機上有攝像頭,有麥克風,除了拿它來打電話,實現人與人之間的溝通交流之外,我們也可以拿手機拍照、拍視頻、錄音、采訪,然后把這些內容分享到YouTube或抖音上,這樣的內容叫做UGC。U就是user,用戶、消費者,這樣產生的內容相對來說質量比較差一些,但是核心是方便。其實現在市面上也有非常多的人,拿這樣的設備,我們叫c端設備,或者是用戶側的設備去做內容,這個叫UGC。 我們塞賓準確意義上來說,不是做這種UGC的產品,很多時候也不是pgc的產品,而是我們稱之為pugc的產品。Pugc實際上是這個產品的形態和使用上面來說,更接近c端的消費者,跟手機一樣非常方便使用,無論是麥克風還是耳機、音箱、聲卡這樣的設備。 主持人:也就是說用起來不麻煩,買起來也不是很貴。 張博:但是它產生的內容的質量,是接近pgc這種制作方法或制作設備制作出來的攝影體驗。 主持人:但是大家經常說一分價錢一分貨十分價錢買不錯,我是一個聲音愛好者,在我正式從事廣播這個行業之前,也在這個領域花了很多錢,知道其實好的音頻設備是很貴的,但是今天您又說可以把它做成非常低的價格,這個中間是怎么實現的? 張博:以前的設備特別貴,有一些是歷史性的因素。我舉個例子,以前在大家聽HiFi的年代,所謂的HiFi就是一對立體的箱子,人坐在等邊三角形的頂點上,聽立體聲箱子發出來的古典音樂會的典型場景。音箱的背后它有功放,功放里面以前都是叫a類功放,有的是用這種電子管,電子管放大的聲音很暖,相應的一些模擬器件的造價是比較昂貴的。如果要讓它做的好,就要花很高的價錢。再舉一個例子,我們當時用的這些傳輸線。 主持人:對,導線要用金線銀線。 張博:為什么用金線銀線?并不是說金線銀線顯得高貴,而是金銀的傳輸傳導率比較高,它能夠實現聲音的傳輸質量更好一些。當時模擬音頻時代有這么個貴的道理。但是到了現在,我們其實是盡可能的非常早的把模擬音頻變到數字領域。 主持人:所以您的意思是正因為我們進入到了數字領域,所以在底層的聲音的編解碼的層面來說,我們就已經節省了很多的成本對。其實除此之外,還有一些成本的降低,也是跟咱們國家近些年工業化的程度不斷上升,而且大規模制造的程度不斷上升是有關系的。那么時間的原因,我們本期科創中國只能暫且聊在這里了。今天塞賓科技的創始人兼CEO張德明先生跟我們分享了他在聲音創業領域的很多故事,但是這僅僅是一個開始,未來我們還會邀請張總來節目中和大家聊一聊他所鐘愛的聲音設備的制造,包括傳輸的相關故事。 文章素材來源:塞賓科技 編輯:溫情
|
|
|