DeepSeek后更大的機遇:AI端側推理創新 | 智在終端
AI正在成為新的UI
明敏 魚羊 發自 凹非寺
量子位 | 公眾號 QbitAI
每年開春的“新機潮”,今年出盡風頭的是DeepSeek。
一時之間,幾乎所有主流消費終端廠都在短時間內完成DeepSeek的接入。
榮耀、OPPO、魅族、vivo、小米紛紛官宣自家AI助理上線DeepSeek-R1及其滿血版;甚至OPPO今年新發的旗艦大折疊Find N5,也強調了對DeepSeek的支持。

另一個被掀起鯰魚效應的是車圈。
一個月內,吉利、比亞迪、奇瑞、嵐圖、長城、理想等超過20家車企宣布接入DeepSeek,形成汽車與AI加速融合的一個切面。
熱潮之下是技術洪流不斷向前涌動——
AI正在進入推理創新時代。
如此趨勢認知來自高通。DeepSeek效應從AI領域向外輻射,從算法創新逐漸演變成對每個人生活工作的潛在影響。
輻射普羅大眾,消費終端是關鍵橋梁。
由此,在當下節點,一份對AI端側趨勢的梳理就變得尤為重要。高通最新發布的白皮書《AI變革正在推動終端推理創新》,已梳理出四大趨勢:
- 先進AI小模型已具有卓越性能
- 模型參數規模正在快速縮小
- 開發者能夠在邊緣側打造更豐富的應用
- AI正在成為新的UI
透過這份行業分析,AI推理之于終端將產生哪些影響?也就有更明了了。
AI正在進入推理創新時代
最首要的問題,DeepSeek這條“鯰魚”究竟改變了什么?
之于行業內,大模型端側趨勢早已是暗流涌動。在ChatGPT爆火后,高通就提出了混合AI的概念。
它強調,隨著生成式AI不斷發展,AI處理必須分布在云側和終端進行,才能實現AI的規模化擴展并發揮其最大潛能。它幾乎適用于所有生成式AI應用和終端領域,包括手機、筆記本電腦、XR頭顯、汽車和物聯網。
從當時來看,節省成本是推動混合AI架構的主要因素之一。一次AI問答所需的成本是傳統搜索的1000倍,混合AI能夠通過和終端設備協同算力的方式,降低云端計算的成本。同時兼顧個性化、隱私保護等需求。
這也造成了部分AI體驗被閹割的問題。由于當時推理Scaling Law(語言模型中的規?;▌t行為)尚未被提出,模型能力與參數規模呈強烈正相關,盡管廠商們也陸續推出小型號模型適應端側需求,但性能和精度水平仍舊受到限制。
在實際進展上,高通在過去幾年先后發布的第三代驍龍8、驍龍X Elite和驍龍8至尊版等平臺上,開始強化終端芯片對生成式AI能力的支持。手機、PC廠商們在此基礎上進一步發力,陸續推出本地支持AI能力的新機,AI端側應用迎來一波小趨勢,不僅手機助手都更加智能化,也衍生出AI一鍵消除路人、AI語音通話總結等原生AI端側應用。
可以說,在過去幾年,端側AI已搭建好初步的框架和地基。若有更強勁的東風,這股新趨勢便將進一步爆發。
高通技術公司高級副總裁兼技術規劃和邊緣解決方案業務總經理馬德嘉(Durga Malladi)近期的采訪,進一步驗證了外界的猜測:
我們在去年11月份的時候已經做出了這樣的預判,會有越來越多的高質量模型在搭載驍龍平臺的終端側運行,讓開發者能夠在邊緣側打造更豐富的應用。
果然,在2025年,推理模型DeepSeek-R1這股東風到來。它從模型層面為困擾端側AI已久的成本問題,提供了全新解決思路。
通過使用思維鏈推理數據和非推理數據微調,并進行蒸餾,DeepSeek-R1實現了將推理能力賦予到小規模稠密模型上。
這意味著,高質量且小規模的模型并非不可能實現。DeepSeek一聲驚雷過后,這樣的模型只可能比人們預想中的還要多、還要實惠。
由此,高通對當下趨勢進行梳理,在白皮書給出四大值得參考的方向。一方面是為了在發展中總結經驗,另一方面也是與行業一起探討前路方向。
其中,第一點被提及的還是快速進化的AI模型。
現如今,不僅模型質量在進一步提高,開發方式其實也在變得更便捷。
經過多年探索,目前AI領域內針對不同模型需求,已經形成了諸多范式。
比如針大規模模型,可以使用MoE(混合專家模型)、SSM(狀態空間模型)等架構來降低計算開銷,同時保證模型質量;使用思維鏈和自我驗證等,能夠大幅提升模型在數學、編碼、推理等方面能力;對于小模型,蒸餾技術的普遍應用能夠讓大模型“教學”小模型,保持準確性的同時遷移知識,進一步降低開發難度,一定程度上避免重復造輪子。

其次,從全行業范圍看,模型參數規模正在快速縮小。
量化、剪枝、蒸餾等技術下,大模型的性能可以很好遷移到小模型上。
基于通義千問模型和Llama模型的DeepSeek蒸餾版本,在GPQA基準測試中,與GPT-4o、Claude 3.5 Sonnet和GPT-o1 mini等先進模型相比,取得了相似或更高的分數。

此外,讓模型更“濃縮精華”也是正在發生的趨勢。根據Epoch AI整理的數據,2024年發布的大規模AI模型中,超過75%的模型參數在千億規模以下。

第三,高質量模型激增,開發者有了更多選擇,邊緣側的AI應用正在滲透到普通用戶的日常用機習慣中。
比如文檔摘要、AI圖像生成和編輯以及實時語言翻譯,已經成為如今AI手機上的常見功能。影像方面更是可以利用AI進行計算攝影、物體識別和場景優化。
這些都得益于AI推理在終端側的廣泛普及。
由此更進一步,AI正在成為新的UI。
隨著大模型入駐手機、PC,傳統的屏幕交互正在被變革、顛覆,個性化多模態AI智能體可以簡化人機交互流程,高效地跨越各種應用完成任務。
比如榮耀去年火出圈的“一句話點咖啡”,就是一個例子。
當然還不止于手機、PC、汽車等消費級終端,未來在機器人、無人機以及其他自主設備上,AI也有望實現實時決策,在動態的真實環境中實現精確交互。
綜上,隨著AI進入推理時代,終端側的創新與應用落地被進一步激發,AI格局甚至都將就此發生改變。
那么問題來了——
AI推理時代需要什么?
DeepSeek-R1的蒸餾模型,在問世不到兩周時間內就被爭相接入各種終端,令不少業內人士都驚嘆不已。
而在DeepSeek之外,值得關注的是,大部分接入的終端產品都是“高通芯”。
關鍵的一點是,在DeepSeek攪動風云之前,高通就已經進行了前瞻預判:AI計算處理將從云端向邊緣側擴展。
2023年5月,高通發布了《混合AI是AI的未來》白皮書,其中提到:
AI處理必須分布在云端和終端進行,才能實現AI的規模化擴展并發揮其最大潛能。
而決定進程的影響因素包括:終端能力、性能需求、隱私和安全需求,以及商業模式等諸多因素。
簡單歸納,核心回到3個問題:
- 硬件設計是否能滿足模型對終端算力的需求?
- 相比云端模型,終端“小”模型是否足夠好,足夠多,足夠便宜?
- 打通軟硬件的AI Infra(人工智能基礎設施,連接算力和應用的AI中間層)是否完備,終端側的生態系統是否健全?
圍繞這3點,再回溯高通這兩年以來的技術布局,不難看出,高通在終端AI領域,再次引領了時代之先。

首先,是高性能、高能效的芯片設計。
高通長期致力于開發定制CPU、NPU、GPU和低功耗子系統,同時擁有封裝技術和熱設計的技術專長,構成了其行業領先系統級芯片(SoC)產品的基礎。
這些SoC能夠直接在終端側提供高性能、高能效的AI推理。
比如,驍龍8至尊版除了在對AI最為關鍵的NPU上帶來一系列升級,在CPU和GPU上同樣做了不少文章,以更加充分地釋放SoC的AI能力。
包括引入自研Oryon CPU,應對對時延敏感的AI任務,比如實時翻譯、AI助手命令響應等,并負責將AI任務分配到其他核心上。
而驍龍8至尊版的Hexagon NPU,目前已經可以支持70+ Tokens/秒、4K上下文的生成能力;并為應對多模態AI任務增加了額外的內核。
又比如驍龍X系列平臺,其專為實現高性能、高能效的生成式AI推理而打造的NPU核心,對定義全新AI PC品類發揮了關鍵作用。

△MWC2025高通展區畫面
其次,是覆蓋所有關鍵邊緣細分領域的可擴展性。
不僅是手機、PC,在XR頭顯和眼鏡、智能汽車,以及工業互聯網等諸多終端場景中,高通的身影無處不在,并代表著最先進的技術水平。

△MWC2025中高通展區展出搭載驍龍XR平臺的終端
而在所有這些場景中,高通始終在更加積極、極致地融入、提升AI能力。
比如在本屆MWC上,高通發布高通躍龍第四代固定無線接入(FWA)平臺至尊版,基于高通X85打造,支持長達14公里的毫米波遠程通信——
高通提到,毫米波覆蓋范圍的擴大得益于AI優化和AI輔助波束選擇技術。
而其流量分類和智能網絡選擇等AI功能,也是基于X85這顆5G AI處理器的AI能力實現的。

又比如驍龍數字底盤解決方案,在其情境感知智能座艙系統中使用終端側AI,旨在增強汽車安全和駕駛體驗。該系統利用先進攝像頭、生物識別、環境傳感器以及先進的多模態AI網絡,提供根據駕駛員狀態和環境條件而調整的實時反饋和功能。
針對自動駕駛和輔助駕駛系統,高通開發了端到端架構,利用大規模訓練數據集,基于真實世界數據和AI增強數據的快速再訓練、OTA更新以及包括車內多模態AI模型和因果推理在內的先進軟件棧,應對現代自動駕駛和輔助駕駛的復雜性。

目前,高通的硬件和軟件解決方案已賦能數十億智能手機、汽車、XR頭顯和眼鏡、PC以及工業物聯網等終端,為廣泛行業帶來高性能、經濟實惠、快速響應和關注隱私的變革性AI體驗。
值得關注的是,硬件之外,通過高通AI軟件棧、高通AI Hub和開發者協作,高通已構建起完備的生態系統策略,面向不同邊緣終端領域的模型部署提供工具、框架和SDK,賦能開發者在邊緣側加速AI智能體和應用的落地。
也可以這樣理解——通過高通生態的支持,開發者面向不同平臺進行重復開發時,只需一次開發,即可輕松實現跨多平臺高效部署。

毫無疑問,大模型從云端擴展到終端的過程中,蘊藏著巨大的機會——
甚至可以說,這是這場“模力時代”變革之中,能最快觸達最多人群、引發新爆點的應用領域之一。
而機會總是率先青睞有準備的人,每一次技術變革中,引領潮流的都是有更長遠預判,以及孜孜不倦深耕、賦能行業未來的企業、團隊。
現在,在AI推理創新時代的開端,以高通為代表的技術上游已經站上潮頭,亮出越來越令外界驚喜的手牌,推動著整個行業加速發展。
更多的創新創造,正在涌流。
至少終端側的智能新可能,已經在2025,初現曙光。
- 蘋果芯片主管也要跑路!庫克被曝出現健康問題2025-12-07
- 世界模型和具身大腦最新突破:90%生成數據,VLA性能暴漲300%|開源2025-12-02
- 谷歌新架構突破Transformer超長上下文瓶頸!Hinton靈魂拷問:后悔Open嗎?2025-12-05
- 90后華人副教授突破30年數學猜想!結論與生成式AI直接相關2025-11-26



