智能音箱終于秀得起音質了……
蘋果都放棄的高端智能音箱,國產廠商能玩出什么花?
夢晨 發自 凹非寺
量子位 | 公眾號 QbitAI
記得前幾年智能音箱剛火的時候,挺想買一個嘗嘗鮮,不太貴的那種。
智能方面我還算會挑,音質方面可就不太懂了。
于是去找玩音響的朋友問問有什么推薦,哪款音質好一些?結果他的回答讓我挺無語的:
音質上沒什么可挑的,都是聽個響,你就看哪家智能做得好吧。
如今幾年過去,情況在變化。
在蘋果放棄價格賊貴的HomePod之后,國產智能音箱卻開始拼音質了。
華為聯合音響品牌帝瓦雷推出高端產品Sound系列,音箱部分極致堆料,智能部分主推搭載鴻蒙,其中最高端型號Sound X價位來到2000+。
小米也聯手哈曼卡頓推出主打音質的小體積產品Xiaomi Sound,延續性價比傳統定價499,被網友戲稱為“年輕人的第一臺高端智能音箱”。
這么熱鬧,自然也少不了另一大玩家天貓精靈,最近其在高端產品上的布局終于浮出水面——
- 與頂級聲學機構波士頓聲學深度合作,聯合打造的高端智能聲學新品Sound系列已于6月1日上市。
- 其中,Sound Pro到手價為1299元,配備了5.25英寸的60W低頻發聲單元,實現了罕見的35Hz低頻下潛,可以說已經能挑戰同品類天花板了。
智能聲學,便是天貓精靈新品身上最醒目的標簽,這里可以先來分享一波Pro版的提前試用體驗。
首先,這款產品外觀就給人很大沖擊力。一反之前型號小巧纖細的“網紅感”,設計上也更接近經典造型。
主觀感受上,大箱體發出的聲音確實比之前的小體積型號更飽滿,特別是低音表現,有很嗨的感覺了。
接下來是主打新功能之一智能EQ調音。
內置算法可以自動選擇最佳音效,無需手動調整復雜參數。據說這次還特別為電子核、情緒搖滾等小眾音樂類型有專門調音。
主打新功能之二獨家“貓耳算法”,解決了大音量聽歌時音箱聽不見你說話的問題。
實際體驗下來, 即使是80%超大音量播放新晉的跳操神曲《本草綱目》,也可以用正常說話的音量和音箱交互。
極限場景下,跑到廚房里打開抽油煙機再關上門,都能成功喚醒客廳里大聲播放音樂的天貓精靈。
下面就來扒一扒這些新功能背后,都有哪些新技術在支撐。
搭載了什么新技術?
先來說說這個貓耳算法,根據貓耳朵能獨立旋轉180度并通過內部褶皺準確定位聲音來源而得名。
要想用算法實現這一特性,要做到三個部分。
第一個是回聲消除,也就是麥克風收音時需要消除掉音箱自己發出來的聲音。
回聲一般分為線性和非線形兩部分。對于線性回聲主要通過線性濾波器的傳統算法來解決,對于非線性回聲天貓精靈增加了深度學習算法來解決。
第二個是聲源定位,增加使用了喚醒詞的信息,包括喚醒詞上每個頻點人聲的比例,綜合利用聲學信息和語音特征增加準確率。
第三個是降噪,也是傳統算法與深度學習結合,先用噪聲識別模型區分出人聲與非人聲,再分別用不同的算法去處理。
接下來是智能EQ,也被天貓精靈團隊稱為不包漿均衡器。
總體思路是通過軟件算法與低失真功放芯片協同工作,在為不同音樂帶來匹配的音效同時不過度渲染,盡量還原音樂本身想表達的感覺。
具體細節上共有1040段智能參數,除了4種預制模版(HiFi、古典、人聲、勁爆)外,默認還可以選擇智能模式根據音樂類型動態匹配。
硬件上的創新之處還有智能一體腔。
通過改進結構堆疊設計,將音腔容積增加了29%,無源輻射器和揚聲器因此可以輻射出更多的低頻效果。低頻到位了,聽起來就更帶感。
通過優化結構堆疊及裝配,改善了腔體的振音,震動以及內部駐波, 使mic收音更純凈,提高智能語音交互的效果。
除了音質方面外,智能音箱本身也是內容的提供者,需要在不連接PC或手機的情況下獨立工作。
天貓精靈與眾多平臺進行內容授權合作,把多平臺內容聚合在一起。
也就是說,智能音箱反倒沒有手機上聽歌要切換不同App的煩惱~
除了音樂以外,有聲讀物、播客資源也能一網打盡。
有了內容,接下來還要考慮分發和推薦。
考慮到音箱的家庭使用情景,天貓精靈開發了智能身份識別系統,可通過聲紋來識別不同使用者的角色。
就像指紋一樣,每個人的聲音也有獨特的聲紋特征。就像給手機錄入指紋一樣,采集了3個不同距離下的聲紋后就可以準確識別。
不同角色的聲紋采集好之后,可以選擇興趣標簽,讓智能音箱的內容推薦有“更懂你”的感覺。
再結合上長時間使用后學習到的使用場景,可以在需要時及時送上需要的內容。
當然,整個過程都是符合信息安全認證國際標準的,包括基礎的ISO 27001、擴展的ISO 27018、以及最新的ISO 29151。
在天貓精靈這次的新品上諸多智能聲學技術都是第一次亮相,但其實早在4年前就已布局。
下面再來揭秘一下,背后這只獨特的研發團隊——
天貓精靈聲學實驗室
據介紹,實驗室聲學成員平均有13年聲學設計經驗,來自哈曼、樓氏、AAC、飛利浦等全球知名公司。
其中負責人汪濤更是哈曼“金耳朵”全球認證測試中0錯題達到level 14難度的滿分選手。
實驗室有20多間聲學試驗場地,成立4年來已積累了數十項相關專利,形成了獨特的智能聲學發展路線。
成果除了前面介紹過的以外,還有虛擬多聲道搭建、千人千面音質設計方案、聲場自適應校準等專利技術。
天貓精靈為什么要花大力氣自建聲學實驗室呢?
從目的上,是要通過跨領域技術融合創新解決音箱產業長期以來有智能與音質難以兼容的難題。
工作方式上,也是提供了讓聲學團隊與電子、算法和設計等內部團隊通過AliGenie一體化研發平臺高效協作的模式。
除了內部的協作,聲學實驗室也是天貓精靈這家公司與外部聲學行業合作的一個連接點。
有了既懂聲學又懂智能的實驗室團隊,天貓精靈與音響品牌波士頓聲學的合作可以更加深入。
這一次雙方的合作不僅限于表面的品牌背書,也不是單純的購買發聲單元等器件,而是在聲學架構上進行了深度協同研發,包括算法、硬件、調音之間的協同。
前面介紹過的智能EQ調音,和智能一體腔效果,也加入了波士頓聲學專家的參數建議。
像這樣把傳統音箱聲學、AI算法、智能物聯等多學科跨領域技術進行創新融合的模式,不僅產出應用在音箱產品上能給用戶帶來更好的體驗,還產生了1+1>2的效果。
在量子位與天貓精靈人工智能部總經理姜飛俊的交流中,他表達了這樣的觀點。
智能音箱最重要的地方,是帶來不同于動手操作的全新交互方式,技術上稱為“遠場語音交互”。
從這個視角看,通過智能聲學沉淀出的相關技術還可以遷移到更多適合搭載語音交互的智能物聯網產品,如時下爆火的掃地機器人、智能跑步機等運動器材。
進一步看,技術成果應用到多樣場景,反過來也能推動技術本身迭代進化。
例如,音箱擺放在室內固定位置,面對的環境噪聲也相對固定。而掃地機器人自身就在移動,也會產生變化性更大的噪聲,對語音識別定位和降噪能力提出新的要求。
再例如,深度學習算法應用到掃讀筆等更小型、計算能力有限的設備時,又會推動算法本身朝輕量化、易部署方向演進。
- GPT-5.2果然反超谷歌Gemini 3 Pro!北大數院校友核心貢獻2025-12-12
- 釘釘又發新版本!把 AI 搬進每一次對話和會議2025-12-11
- 英偉達自毀CUDA門檻!15行Python寫GPU內核,性能匹敵200行C++2025-12-08
- GPT-5-Thinking新訓練方法公開:讓AI學會懺悔2025-12-04




