從驍龍8至尊版，我看到了AI手機的未來 | 智在終端

魚羊 2024-12-17 12:15:21 來源：量子位

語音助手、實時翻譯脫胎換骨，AI變革每個應用，端側芯片成為變革關鍵

明敏魚羊發自凹非寺

量子位 | 公眾號 QbitAI

安卓新王驍龍8至尊版一出，2024年最后一季度的手機市場再度火熱起來。

新硬件，新功能，讓人眼花繚亂的表象之下，核心關鍵詞必然是：AI，AI，還是AI。

無論是榮耀的一句話命令，讓手機助手按照你的習慣幫你點奶茶：

還是超級小愛的幫你記、幫你找：

如果說此前市場對于AI手機還有“蹭大模型熱度”的猶豫和質疑，那么如今各大廠商都在用實際進展證明：

端側AI，已經成為手機新的競爭焦點。

而如此時間節點的如此變化，反映的一個事實是，應用側的堅定AI化，背后更關鍵的信心來源之一，依然是底層硬件的變化。

不只是堆料堆算力，讓大模型能被裝進手機，更是為了讓AI能在端側真正被用起來、用得好，圍繞AI進行的全方位性能升級，甚至顛覆重構。

在量子位舉辦的MEET 2025智能未來大會上，2024人工智能年度杰出產品榜出爐，高通的驍龍8至尊版移動平臺入選，關鍵原因之一便是其正引領終端側AI的發展，并對行業廣泛賦能。

各種細節，今天，我們就掰開驍龍8至尊版，一項一項具體來看。

AI手機需要什么樣的芯片？

作為新一代手機最強芯，驍龍8至尊版的核心目標很明確：全面重構性能、全面重構AI。

先來看整體的數據：

CPU單核和多核性能相比前代均提升45%，瀏覽器性能提升62%，同時，CPU功耗降低44%。

GPU性能提升40%，光線追蹤性能提升35%，同時，GPU功耗降低40%。

NPU增加額外內核，擁有6核向量處理器和8核標量處理器，AI性能提升45%，每瓦特性能提升45%，支持70+tokens/s的輸入，以及4k上下文窗口。

驍龍8至尊版還支持高達10.7Gbps速率的LPDDR5X內存，以增強終端側AI的使用體驗。

不難看出，在猛攻性能的基礎之上，高通在這一代驍龍旗艦芯片上，又著重強調了性能與功耗的平衡。

本質的原因，還是要適配AI手機時代的全新變化。

在今年的驍龍峰會上，高通官方也從用戶體驗的視角，對這些變化做了更全面的展示：

首先，是真正“知你所言，懂你所想”的個性化多模態AI助手。

就像手機廠商們正在競相宣傳的那樣，大模型加持下的AI助手，不僅僅是“聽得懂人話”版的增強型語音助手，更關鍵的是，它能充分挖掘用戶在手機端留存的個性化數據，通過分析用戶的操作、語音等信息，在準確感知、理解用戶意圖的基礎之上，變革人機交互體驗——從單一場景到多場景、多任務，甚至是從人找服務到AI助手主動為人做策劃。

比如，讓AI助手看一眼你的旅行賬單，Ta就能自動根據你的行為偏好，幫你分析怎么更好地省錢。

其次，手機傳統的宣傳重點——影像體驗也將進一步被AI重構。

具體體現為，很多原本需要后期才能實現的圖像和視頻效果，現在實時就能在手機端實現。

比如利用無限語義分割技術（支持250+層語義識別和分割），精細控制照片的每一處細節。即使光線不佳，NPU也能識別不同圖層，進而預測皮膚和天空的色調，呈現更完美的拍攝效果。

又比如視頻通話或直播時的實時AI補光，可以添加虛擬的可移動光源來給人臉“打光”，提升人像在鏡頭中的觀感。

另外，去年火爆的手機端照片“路人消除”大法，現在進一步延展到了視頻當中。

劃重點：這樣的操作可以完全脫離云端，在終端設備上本地完成。

當然還有游戲體驗。

網易已經第一時間官宣了和高通在《永劫無間》手游上合作的最新進展：除了更強性能下更高的游戲幀率和穩定性外，基于高通Hexagon NPU，《永劫無間》手游首次將18億參數大模型引入智能手機，打造全新升級的端到端AI隊友功能。

該功能不僅能讓AI隊友聽懂玩家的語音對戰指令，還支持人類和AI玩家之間的自然語音對話，首詞時延可控制在300ms以內。

可以說，AI化的框架已經全面搭建起來，更多AI手機細節功能的實現，就要看各路手機廠商的本事了。

簡單總結一下，在驍龍8至尊版支持下，AI手機在以下幾個維度有了明顯提升：

AI運行速度
多模態交互
AI Agent（智能體）“自動駕駛”

在其背后，無論是能在手機上調度各種功能的AI助手，還是更AI的影像、游戲體驗，都意味著更多Agent進入手機，意味著更復雜的系統調度和數據分析。

那么，問題就來了：手機畢竟是重量僅為200克左右的終端設備，性能之外，電池續航、發熱問題同樣是直接影響用戶體驗的因素。

來到AI手機時代，性能與功耗之間的矛盾更加凸顯，具體又待如何解決？

CPU+GPU+NPU，釋放AI能力

這次，除了對于AI而言最為關鍵的NPU，在CPU和GPU上，高通同樣做了不少文章。

在CPU上，高通歷史性將自研Oryon CPU帶到移動端。

它負責處理對時延敏感的AI任務，比如實時翻譯、AI助手命令響應等。并負責將AI任務分配到其他核心上。

它在架構上全面升級，采用“2+6”模式，2枚超級內核+6枚性能內核，取消效率內核。

超級內核最高主頻達到4.32GHz，明顯超越同行。

6個性能內核都經過調優，負責運行最密集型的應用程序，用亂序性能內核取代了傳統的效率內核，實現了效率和能耗的既要又要。

內存架構上，Oryon CPU每個CPU叢集配備最大的緩存，即每個叢集都擁有12MB的二級緩存，總計24MB緊密耦合的專用緩存，這也是移動領域最大的緩存。

同時也增加了每個超級內核和性能內核中的L1緩存。

如前所說，Hexagon NPU方面，高通也帶來一系列升級。

在NPU驅動下，可以完成70+Tokens/秒、4K上下文的生成能力。Token是信息構建模塊，可以是文本、語音，甚至是照片和視頻。驍龍8至尊版以支持更長上下文窗口和更多token輸入量。更長的上下文窗口將為用戶的AI助手提供更豐富的情境信息，以便進行復雜推理。

并為應對多模態AI任務增加了額外內核。

值得一提的是，驍龍8至尊版首次實現了讓AI助手完全運行在終端時理解攝像頭中拍攝的內容，用戶可以通過攝像頭和AI助手實時互動。

利用手機的豐富傳感器，AI助手可以結合用戶的位置、偏好和個人習慣創建個性化神經網絡，以便AI助手針對用戶需求生成個性化回復。

高通傳感器中樞是實現個性化AI助手的門戶，驍龍8至尊版對其進行了一系列改進，它現在的AI性能提升了60%。

為了更好支持大語言模型、超長文本應用等，張量加速器方面也做了增強。

此外，內存并發性，AI和計算機視覺工作負載現在可以同時訪問一個內存空間并協同工作，創造流暢有趣的體驗。

GPU方面，驍龍8至尊版首次推出了Adreno GPU切片架構，將內部渲染單元分為三個獨立切片，其中每個切片都可以運行在對應主頻。

這樣一來就能實現動態調整不同工作負載，得益于這一架構，GPU性能提升40%，功耗降低40%。

GPU支持12MB內存，可以減少數據傳輸交互時對系統內存的訪問調用。

基于如上底層計算的全面升級，完全在終端運行的個性化、多模態AI助手等全新體驗得以走進現實。

但是底層計算只是實現這一切的基石。軟件層面，先進算法和海量工具，是生成式AI應用得以繁榮的另一大關鍵。

與智譜、騰訊混元達成大模型合作

AI重構手機，不僅是交互模式、計算范式上發生巨變，更關鍵在于上層應用生態也將被快速重塑。

各種APP、功能都在引入AI，手機廠商、AI廠商、互聯網大廠都在積極嘗試。不過怎樣才能更充分調用底層計算、發揮大模型能力，構建真正滿足大家需要的AI應用？現在確實還處在探索早期。

所以可以看到，在完成對端側AI計算的定義后，高通開始更進一步促成上層應用生態的構建。

今年，伴隨著驍龍8至尊版正式發布，高通還官宣了兩則重磅消息——和智譜以及騰訊混元的合作。

兩家的合作，也印證了AI手機的兩大發展方向：端側與多模態。

在和智譜的合作中，高通明確提到將GLM-4V端側視覺大模型將面向驍龍8至尊版進行深度適配和推理優化，支持豐富的多模態交互方式。

今年早些時候，智譜推出了國內首個類GPT-4o視頻通話功能，底層模型基于GLM-4V-plus，在圖像和視頻理解方面都取得了不錯成績。

驍龍峰會上，高通也表示現在AI助手可以完全在終端側通過攝像頭看到用戶所看到的內容，用戶可以通過相機實時模式和AI助手互動，也就是把AI視頻通話徹底放在端側。

據介紹，用戶可以直接把攝像頭對準賬單收據，然后AI通過推理來計算個人應付的賬單。

和騰訊混元的合作中則提到，雙方將基于驍龍8至尊版共同推動混元大模型7B和3B版本的終端部署。

這兩項合作的官宣意味著智譜和騰訊混元大模型，未來將有可能深度參與驍龍平臺上先進AI應用范例的開發與打造。

實際上，在大模型趨勢開始后，高通就馬上推出了AI Hub，為開發者和企業構建了一個開放的AI開發平臺。

在AI Hub上，開發者可以找到各種主流大模型，利用高通提供的工具集進行開發。

它能讓開發者充分利用高通芯片的計算能力，將AI推理放置在設備端，實現低延遲、高效率的本地化AI處理，進一步豐富端側AI應用。

平臺提供的工具集能夠幫助開發者優化AI模型，使其在高通芯片上運行更加高效，同時簡化了部署過程。

同時，AI Hub與高通的其他開發工具緊密結合，如Qualcomm Neural Processing SDK（神經處理SDK），為開發者提供全面的開發環境。

更早之前高通推出的AI軟件棧（AI Stack），還全面支持主流AI框架（如TensorFlow、pytorch、ONNX和Keras）和runtime（如 TensorFlow Lite、TensorFlow Lite Micro、ExecuTorch和ONNX runtime），能幫助開發者進一步加快開發流程。

軟硬結合，才能更徹底釋放AI手機的潛力。

比如前面提到的實時AI補光技術，就是算法和底層硬件高效連接的成果。

在影像領域，高通將先進的AI算法直接引入圖像和視頻處理管線的核心（Insight AI），其中的無限語義分割功能，支持對圖片進行超過250層語義識別與分割。在完成分割后，實時皮膚和天空算法可以利用NPU來識別光線條件并進行修圖，保障在強光條件下也能拍出自然的皮膚和天空色調。

從CPU變革到AI手機變革

所以，高通如何理解AI手機？

APP/應用成為人類使用互聯網的入口，構成了當下人機交互最重要的范式。

AI的出現讓這些熟悉的事物開始瓦解，當機器開始理解人類語言，交互可以變得更為主動，智能化體驗也將被重新定義。

在驍龍峰會上，高通總裁兼CEO安蒙一語道破：

我們將看到，應用程序的不斷進化所催生的全新體驗……而且這不局限在某一個殺手級應用，而是每一個應用的體驗都將改變。

如今，驍龍8至尊版為實現這一愿景提供了一個強大平臺。

在這里，移動計算被重構，移動計算的發展方向也更加明了——

當AI成為移動設備的全局性能力，更強大的CPU將成為必需，小核已經成為過去時。NPU作為天生為AI而來的硬件核心，負責為多模態、超長文本等能力提供支持。GPU則繼續在擅長的游戲、圖像領域發揮能力。

當然，為了滿足AI模型運行的需求，大內存也成為必然。

由此，語音助手、實時翻譯等功能才能提供更快速響應、更智能回復，得以脫胎換骨成為真正意義上的AI應用。

2024年，AI手機的趨勢已經勢不可擋。這是從算法到應用再到底層計算的全方位變革。

而想要真正意義上帶來AI手機風暴，這個邏輯或許要轉換一下，先從底層計算看起。

已經為行業定義了NPU的高通，如今正從CPU開始，為行業重新定義AI時代的移動計算。

— 完 —

AI手機驍龍8至尊版高通

魚羊

從驍龍8至尊版，我看到了AI手機的未來 | 智在終端

AI手機需要什么樣的芯片？

CPU+GPU+NPU，釋放AI能力

與智譜、騰訊混元達成大模型合作

從CPU變革到AI手機變革

相關閱讀

高通宣布與華為達成新專利授權協議

4199元起！OPPO新旗艦首發自研AI系統，隨時隨地一鍵問屏，Pro版還有iPhone 16同款物理快門

高通推出第三代5G調制解調器驍龍X60，三星電子拿下部分代工訂單

安卓裝DeepSeek就敢賣8999！最薄折疊？那沒事了

異構計算+高性能低功耗NPU，高通正在推動終端側生成式AI發展

大模型加速涌向移動端！ControlNet手機出圖只需12秒，高通AI掌門人：LLaMA也只是時間問題

熱門文章

“豆包手機”在二手市場價格都翻倍了……

英偉達巧用8B模型秒掉GPT-5，開源了

谷歌新架構突破Transformer超長上下文瓶頸！Hinton靈魂拷問：后悔Open嗎？

SpaceX估值8000億美元超OpenAI，IPO就在明年

Ilya剛預言完，世界首個原生多模態架構NEO就來了：視覺和語言徹底被焊死