從驍龍8至尊版,我看到了AI手機的未來 | 智在終端
語音助手、實時翻譯脫胎換骨,AI變革每個應用,端側芯片成為變革關鍵
明敏 魚羊 發自 凹非寺
量子位 | 公眾號 QbitAI
安卓新王驍龍8至尊版一出,2024年最后一季度的手機市場再度火熱起來。
新硬件,新功能,讓人眼花繚亂的表象之下,核心關鍵詞必然是:AI,AI,還是AI。
無論是榮耀的一句話命令,讓手機助手按照你的習慣幫你點奶茶:

還是超級小愛的幫你記、幫你找:

如果說此前市場對于AI手機還有“蹭大模型熱度”的猶豫和質疑,那么如今各大廠商都在用實際進展證明:
端側AI,已經成為手機新的競爭焦點。
而如此時間節點的如此變化,反映的一個事實是,應用側的堅定AI化,背后更關鍵的信心來源之一,依然是底層硬件的變化。
不只是堆料堆算力,讓大模型能被裝進手機,更是為了讓AI能在端側真正被用起來、用得好,圍繞AI進行的全方位性能升級,甚至顛覆重構。
在量子位舉辦的MEET 2025智能未來大會上,2024人工智能年度杰出產品榜出爐,高通的驍龍8至尊版移動平臺入選,關鍵原因之一便是其正引領終端側AI的發展,并對行業廣泛賦能。

各種細節,今天,我們就掰開驍龍8至尊版,一項一項具體來看。
AI手機需要什么樣的芯片?
作為新一代手機最強芯,驍龍8至尊版的核心目標很明確:全面重構性能、全面重構AI。
先來看整體的數據:
CPU單核和多核性能相比前代均提升45%,瀏覽器性能提升62%,同時,CPU功耗降低44%。
GPU性能提升40%,光線追蹤性能提升35%,同時,GPU功耗降低40%。
NPU增加額外內核,擁有6核向量處理器和8核標量處理器,AI性能提升45%,每瓦特性能提升45%,支持70+tokens/s的輸入,以及4k上下文窗口。
驍龍8至尊版還支持高達10.7Gbps速率的LPDDR5X內存,以增強終端側AI的使用體驗。

不難看出,在猛攻性能的基礎之上,高通在這一代驍龍旗艦芯片上,又著重強調了性能與功耗的平衡。
本質的原因,還是要適配AI手機時代的全新變化。
在今年的驍龍峰會上,高通官方也從用戶體驗的視角,對這些變化做了更全面的展示:
首先,是真正“知你所言,懂你所想”的個性化多模態AI助手。
就像手機廠商們正在競相宣傳的那樣,大模型加持下的AI助手,不僅僅是“聽得懂人話”版的增強型語音助手,更關鍵的是,它能充分挖掘用戶在手機端留存的個性化數據,通過分析用戶的操作、語音等信息,在準確感知、理解用戶意圖的基礎之上,變革人機交互體驗——從單一場景到多場景、多任務,甚至是從人找服務到AI助手主動為人做策劃。

比如,讓AI助手看一眼你的旅行賬單,Ta就能自動根據你的行為偏好,幫你分析怎么更好地省錢。

其次,手機傳統的宣傳重點——影像體驗也將進一步被AI重構。
具體體現為,很多原本需要后期才能實現的圖像和視頻效果,現在實時就能在手機端實現。
比如利用無限語義分割技術(支持250+層語義識別和分割),精細控制照片的每一處細節。即使光線不佳,NPU也能識別不同圖層,進而預測皮膚和天空的色調,呈現更完美的拍攝效果。

又比如視頻通話或直播時的實時AI補光,可以添加虛擬的可移動光源來給人臉“打光”,提升人像在鏡頭中的觀感。

另外,去年火爆的手機端照片“路人消除”大法,現在進一步延展到了視頻當中。
劃重點:這樣的操作可以完全脫離云端,在終端設備上本地完成。

當然還有游戲體驗。
網易已經第一時間官宣了和高通在《永劫無間》手游上合作的最新進展:除了更強性能下更高的游戲幀率和穩定性外,基于高通Hexagon NPU,《永劫無間》手游首次將18億參數大模型引入智能手機,打造全新升級的端到端AI隊友功能。
該功能不僅能讓AI隊友聽懂玩家的語音對戰指令,還支持人類和AI玩家之間的自然語音對話,首詞時延可控制在300ms以內。

可以說,AI化的框架已經全面搭建起來,更多AI手機細節功能的實現,就要看各路手機廠商的本事了。
簡單總結一下,在驍龍8至尊版支持下,AI手機在以下幾個維度有了明顯提升:
- AI運行速度
- 多模態交互
- AI Agent(智能體)“自動駕駛”
在其背后,無論是能在手機上調度各種功能的AI助手,還是更AI的影像、游戲體驗,都意味著更多Agent進入手機,意味著更復雜的系統調度和數據分析。
那么,問題就來了:手機畢竟是重量僅為200克左右的終端設備,性能之外,電池續航、發熱問題同樣是直接影響用戶體驗的因素。
來到AI手機時代,性能與功耗之間的矛盾更加凸顯,具體又待如何解決?
CPU+GPU+NPU,釋放AI能力
這次,除了對于AI而言最為關鍵的NPU,在CPU和GPU上,高通同樣做了不少文章。
在CPU上,高通歷史性將自研Oryon CPU帶到移動端。
它負責處理對時延敏感的AI任務,比如實時翻譯、AI助手命令響應等。并負責將AI任務分配到其他核心上。
它在架構上全面升級,采用“2+6”模式,2枚超級內核+6枚性能內核,取消效率內核。
超級內核最高主頻達到4.32GHz,明顯超越同行。
6個性能內核都經過調優,負責運行最密集型的應用程序,用亂序性能內核取代了傳統的效率內核,實現了效率和能耗的既要又要。

內存架構上,Oryon CPU每個CPU叢集配備最大的緩存,即每個叢集都擁有12MB的二級緩存,總計24MB緊密耦合的專用緩存,這也是移動領域最大的緩存。
同時也增加了每個超級內核和性能內核中的L1緩存。
如前所說,Hexagon NPU方面,高通也帶來一系列升級。
在NPU驅動下,可以完成70+Tokens/秒、4K上下文的生成能力。Token是信息構建模塊,可以是文本、語音,甚至是照片和視頻。驍龍8至尊版以支持更長上下文窗口和更多token輸入量。更長的上下文窗口將為用戶的AI助手提供更豐富的情境信息,以便進行復雜推理。
并為應對多模態AI任務增加了額外內核。
值得一提的是,驍龍8至尊版首次實現了讓AI助手完全運行在終端時理解攝像頭中拍攝的內容,用戶可以通過攝像頭和AI助手實時互動。
利用手機的豐富傳感器,AI助手可以結合用戶的位置、偏好和個人習慣創建個性化神經網絡,以便AI助手針對用戶需求生成個性化回復。
高通傳感器中樞是實現個性化AI助手的門戶,驍龍8至尊版對其進行了一系列改進,它現在的AI性能提升了60%。
為了更好支持大語言模型、超長文本應用等,張量加速器方面也做了增強。
此外,內存并發性,AI和計算機視覺工作負載現在可以同時訪問一個內存空間并協同工作,創造流暢有趣的體驗。

GPU方面,驍龍8至尊版首次推出了Adreno GPU切片架構,將內部渲染單元分為三個獨立切片,其中每個切片都可以運行在對應主頻。
這樣一來就能實現動態調整不同工作負載,得益于這一架構,GPU性能提升40%,功耗降低40%。
GPU支持12MB內存,可以減少數據傳輸交互時對系統內存的訪問調用。
基于如上底層計算的全面升級,完全在終端運行的個性化、多模態AI助手等全新體驗得以走進現實。
但是底層計算只是實現這一切的基石。軟件層面,先進算法和海量工具,是生成式AI應用得以繁榮的另一大關鍵。
與智譜、騰訊混元達成大模型合作
AI重構手機,不僅是交互模式、計算范式上發生巨變,更關鍵在于上層應用生態也將被快速重塑。
各種APP、功能都在引入AI,手機廠商、AI廠商、互聯網大廠都在積極嘗試。不過怎樣才能更充分調用底層計算、發揮大模型能力,構建真正滿足大家需要的AI應用?現在確實還處在探索早期。
所以可以看到,在完成對端側AI計算的定義后,高通開始更進一步促成上層應用生態的構建。
今年,伴隨著驍龍8至尊版正式發布,高通還官宣了兩則重磅消息——和智譜以及騰訊混元的合作。
兩家的合作,也印證了AI手機的兩大發展方向:端側與多模態。
在和智譜的合作中,高通明確提到將GLM-4V端側視覺大模型將面向驍龍8至尊版進行深度適配和推理優化,支持豐富的多模態交互方式。
今年早些時候,智譜推出了國內首個類GPT-4o視頻通話功能,底層模型基于GLM-4V-plus,在圖像和視頻理解方面都取得了不錯成績。

驍龍峰會上,高通也表示現在AI助手可以完全在終端側通過攝像頭看到用戶所看到的內容,用戶可以通過相機實時模式和AI助手互動,也就是把AI視頻通話徹底放在端側。
據介紹,用戶可以直接把攝像頭對準賬單收據,然后AI通過推理來計算個人應付的賬單。
和騰訊混元的合作中則提到,雙方將基于驍龍8至尊版共同推動混元大模型7B和3B版本的終端部署。
這兩項合作的官宣意味著智譜和騰訊混元大模型,未來將有可能深度參與驍龍平臺上先進AI應用范例的開發與打造。
實際上,在大模型趨勢開始后,高通就馬上推出了AI Hub,為開發者和企業構建了一個開放的AI開發平臺。

在AI Hub上,開發者可以找到各種主流大模型,利用高通提供的工具集進行開發。
它能讓開發者充分利用高通芯片的計算能力,將AI推理放置在設備端,實現低延遲、高效率的本地化AI處理,進一步豐富端側AI應用。
平臺提供的工具集能夠幫助開發者優化AI模型,使其在高通芯片上運行更加高效,同時簡化了部署過程。
同時,AI Hub與高通的其他開發工具緊密結合,如Qualcomm Neural Processing SDK(神經處理SDK),為開發者提供全面的開發環境。
更早之前高通推出的AI軟件棧(AI Stack),還全面支持主流AI框架(如TensorFlow、pytorch、ONNX和Keras)和runtime(如 TensorFlow Lite、TensorFlow Lite Micro、ExecuTorch和ONNX runtime),能幫助開發者進一步加快開發流程。

軟硬結合,才能更徹底釋放AI手機的潛力。
比如前面提到的實時AI補光技術,就是算法和底層硬件高效連接的成果。
在影像領域,高通將先進的AI算法直接引入圖像和視頻處理管線的核心(Insight AI),其中的無限語義分割功能,支持對圖片進行超過250層語義識別與分割。在完成分割后,實時皮膚和天空算法可以利用NPU來識別光線條件并進行修圖,保障在強光條件下也能拍出自然的皮膚和天空色調。
從CPU變革到AI手機變革
所以,高通如何理解AI手機?
APP/應用成為人類使用互聯網的入口,構成了當下人機交互最重要的范式。
AI的出現讓這些熟悉的事物開始瓦解,當機器開始理解人類語言,交互可以變得更為主動,智能化體驗也將被重新定義。
在驍龍峰會上,高通總裁兼CEO安蒙一語道破:
我們將看到, 應用程序的不斷進化所催生的全新體驗……而且這不局限在某一個殺手級應用,而是每一個應用的體驗都將改變。

如今,驍龍8至尊版為實現這一愿景提供了一個強大平臺。
在這里,移動計算被重構,移動計算的發展方向也更加明了——
當AI成為移動設備的全局性能力,更強大的CPU將成為必需,小核已經成為過去時。NPU作為天生為AI而來的硬件核心,負責為多模態、超長文本等能力提供支持。GPU則繼續在擅長的游戲、圖像領域發揮能力。
當然,為了滿足AI模型運行的需求,大內存也成為必然。
由此,語音助手、實時翻譯等功能才能提供更快速響應、更智能回復,得以脫胎換骨成為真正意義上的AI應用。
2024年,AI手機的趨勢已經勢不可擋。這是從算法到應用再到底層計算的全方位變革。
而想要真正意義上帶來AI手機風暴,這個邏輯或許要轉換一下,先從底層計算看起。
已經為行業定義了NPU的高通,如今正從CPU開始,為行業重新定義AI時代的移動計算。
— 完 —
- 蘋果芯片主管也要跑路!庫克被曝出現健康問題2025-12-07
- 世界模型和具身大腦最新突破:90%生成數據,VLA性能暴漲300%|開源2025-12-02
- 谷歌新架構突破Transformer超長上下文瓶頸!Hinton靈魂拷問:后悔Open嗎?2025-12-05
- 90后華人副教授突破30年數學猜想!結論與生成式AI直接相關2025-11-26




