手機(jī)玩游戲大作難在哪?硬件性能要加碼,高能效AI同樣關(guān)鍵
每瓦有效AI性能成為提升用戶長時(shí)間穩(wěn)定體驗(yàn)的關(guān)鍵指標(biāo)
蕭簫 發(fā)自 凹非寺
量子位 報(bào)道 | 公眾號(hào) QbitAI
在手機(jī)上就能“云”玩游戲大作,相信不少玩家聽了都會(huì)心動(dòng)。
然而,雖然5G已來,但云游戲這些年的落地效果并不讓人滿意。
確實(shí)已經(jīng)有平臺(tái)能直接做到云玩游戲(不用下載),但畫質(zhì)低、傳輸延遲高一直很影響游戲玩家的體驗(yàn)。
這是因?yàn)椋词箓鬏斔俣壬先チ耍绻麍D像和視頻處理技術(shù)跟不上,仍然會(huì)給游戲應(yīng)用帶來很大的延遲。所以,想玩好游戲,答案要從AI里找。
AI技術(shù)的發(fā)展確實(shí)給手游玩家們帶來了新的希望。
例如,借助本地AI超分辨率技術(shù),可以使GPU與APU協(xié)同計(jì)算,能夠帶來畫質(zhì)的提升,從而提升本地游戲和云游戲體驗(yàn),并且實(shí)現(xiàn)了性能和功耗的平衡。
△在游戲中采用AI超分辨率算法(示意圖)
問題來了,像移動(dòng)端游戲超分這類和AI有關(guān)的技術(shù)都是現(xiàn)階段應(yīng)用就可以實(shí)現(xiàn)的,然而目前真正落地的還非常少。
其中的難點(diǎn)究竟在哪?
移動(dòng)端AI游戲技術(shù)落地,難在哪?
難在硬件對(duì)AI模型的運(yùn)算效率上。
以云游戲?yàn)槔绻诒镜厥褂肁I技術(shù)實(shí)現(xiàn)游戲超分的同時(shí),又遇到了其他應(yīng)用也調(diào)用AI計(jì)算,勢(shì)必會(huì)給APU等硬件帶來巨大的負(fù)荷。
應(yīng)用AI技術(shù)確實(shí)能給游戲玩家?guī)砀玫捏w驗(yàn),但得是在手機(jī)硬件能同時(shí)運(yùn)行這么多AI模型,且不影響手機(jī)使用體驗(yàn)的前提下。
面對(duì)這種情況,聯(lián)發(fā)科給出了自己的答案。我們可以清晰的看到,在AI這一步棋上,作為手機(jī)核心提供者的芯片廠商是怎么走的。
近期,聯(lián)發(fā)科對(duì)天璣旗艦技術(shù)做了一系列分享,透露了領(lǐng)先AI技術(shù)優(yōu)勢(shì)背后的關(guān)鍵要點(diǎn)——高能效AI。
相比于不少芯片在AI性能上強(qiáng)調(diào)的峰值A(chǔ)I算力,聯(lián)發(fā)科的高能效AI更強(qiáng)調(diào)處理器的每瓦有效AI性能,這也是聯(lián)發(fā)科在設(shè)計(jì)架構(gòu)和優(yōu)化上的關(guān)鍵指標(biāo)。
如何理解每瓦有效AI性能?
例如,處理器每秒能運(yùn)算這樣4個(gè)單位的AI任務(wù),然而實(shí)際的4個(gè)單位AI任務(wù)其實(shí)長這樣:

處理器要想像俄羅斯方塊一樣靈活地分配AI性能,就必須要有良好的任務(wù)排程,充分運(yùn)用好每一個(gè)計(jì)算單元發(fā)揮有效算力,這就是“每瓦有效AI性能”強(qiáng)調(diào)的AI處理能力。
除了能提升AI本身的處理能力以外,“高能效AI”還滿足了移動(dòng)端用戶的另一核心需求:
用戶在使用手機(jī)時(shí),耗電量和應(yīng)用體驗(yàn)往往需要“兼得”。
像超分辨率等技術(shù)采用的AI模型,即使效果再好,如果在運(yùn)行時(shí)給用戶帶來耗電量大幅增加、或是其他性能急劇下降的問題,就會(huì)極大地影響手機(jī)等移動(dòng)設(shè)備的使用體驗(yàn)。聯(lián)發(fā)科的高能效AI則可以很好地解決這個(gè)問題,為用戶帶來體驗(yàn)上的提升。
那么芯片廠商如何提升每瓦有效AI性能?
如何實(shí)現(xiàn)高能效AI?
我們主要從硬件和軟件兩個(gè)方面來看。
硬件上,針對(duì)每瓦有效AI性能這一指標(biāo),聯(lián)發(fā)科在對(duì)自家APU架構(gòu)進(jìn)行評(píng)測(cè)時(shí),會(huì)加入比模型運(yùn)算(速度、準(zhǔn)確率)更多的具體指標(biāo),以提升硬件同時(shí)處理多個(gè)模型的能力。
目前的大多AI Benchmark,基本都是針對(duì)單個(gè)模型在處理器上的運(yùn)算速度、或是準(zhǔn)確率,像語義分割、目標(biāo)檢測(cè)、語音識(shí)別等CV和NLP任務(wù)。
然而現(xiàn)實(shí)場景中,無論是游戲超分、還是更復(fù)雜的其他手機(jī)功能,在處理器上運(yùn)行的AI模型都不止一個(gè)。
單方面追求某一個(gè)模型的速度和準(zhǔn)確率,在實(shí)際進(jìn)行AI模型運(yùn)算時(shí),處理器就容易翻跟頭,出現(xiàn)處理時(shí)間延長、發(fā)燙或是掉幀等情況,用戶體驗(yàn)大打折扣。
為了保證用戶的優(yōu)質(zhì)體驗(yàn),聯(lián)發(fā)科提出了用AI Burnout應(yīng)用程序來對(duì)APU等處理器進(jìn)行多AI模型處理性能測(cè)試。
具體來說,AI Burnout會(huì)像模擬真實(shí)場景一樣,讓處理器重復(fù)進(jìn)行大量運(yùn)算直至停止,來測(cè)試處理器在同時(shí)運(yùn)行多個(gè)AI模型時(shí),是否會(huì)出現(xiàn)急劇發(fā)熱、或是急劇降低的情況,并據(jù)此進(jìn)行優(yōu)化,展現(xiàn)了真實(shí)的AI性能和功耗。
據(jù)聯(lián)發(fā)科介紹,通過這種方式,他們確實(shí)將APU的功耗限制在了1w左右,運(yùn)算多個(gè)AI模型時(shí)也不會(huì)導(dǎo)致明顯的發(fā)燙發(fā)熱現(xiàn)象。
在Al Burnout測(cè)試中,搭載第三代APU的天璣1200獲得了接近450幀/秒的成績,同時(shí)溫度一直保持在40℃以下(用于做對(duì)比分析的競品不足250幀/秒,最高溫度突破45℃),成績亮眼,對(duì)聯(lián)發(fā)科高能效AI在功耗和性能方面的優(yōu)秀表現(xiàn)做出了佐證。
當(dāng)然,除了APU自身表現(xiàn)以外,還需要在架構(gòu)設(shè)計(jì)時(shí)考慮APU與各處理器之間的協(xié)同效率,進(jìn)一步優(yōu)化AI模型的處理速度。

軟件上,硬件廠商也需要設(shè)計(jì)對(duì)應(yīng)的處理平臺(tái),讓AI算法“更快地”適應(yīng)硬件架構(gòu)。
聯(lián)發(fā)科推出的NeuroPilot人工智能平臺(tái),就針對(duì)AI模型做出了更好的優(yōu)化。
一方面,該平臺(tái)支持目前所有的AI主流框架,同時(shí)針對(duì)模型多任務(wù)處理進(jìn)行軟件層上的優(yōu)化,使得采用不同框架編寫的AI模型,也能共同高效運(yùn)行;
另一方面,該平臺(tái)可提供Platform-aware工具鏈,使得移動(dòng)廠商在開發(fā)APP初期,就可以針對(duì)平臺(tái)特性進(jìn)行對(duì)應(yīng)的算法優(yōu)化,進(jìn)一步提升AI模型的運(yùn)算效率。
△聯(lián)發(fā)科MediaTek NeuroPilot
通過聯(lián)發(fā)科NeuroPilot人工智能平臺(tái)與其AI處理器APU的配搭,二者結(jié)合可實(shí)現(xiàn)高能效AI表現(xiàn),也進(jìn)一步給移動(dòng)端提供了更豐富的想象空間。
比如在超分辨率技術(shù)的基礎(chǔ)上,結(jié)合其他AI技術(shù)提升傳輸效率的同時(shí),功耗還不發(fā)生明顯增加。同時(shí),為直播、特效拍照、實(shí)時(shí)光追提供了更高的技術(shù)上限;
在5G傳輸時(shí),AI算法能針對(duì)5G耗電大的情況進(jìn)行智能優(yōu)化,同時(shí)結(jié)合VR等AI技術(shù),在手機(jī)上實(shí)現(xiàn)智能視頻通話、虛擬3D應(yīng)用也并非完全不可能;
在面對(duì)夜景拍攝這種需要AI模型大幅提升畫質(zhì)的場景時(shí),高能效AI技術(shù)使得手機(jī)拍攝也不會(huì)出現(xiàn)明顯快速掉電現(xiàn)象,同時(shí)將功率穩(wěn)定控制在一定范圍內(nèi)……
△AI攝影應(yīng)用(示意圖)
從游戲、5G到拍照等多媒體場景,聯(lián)發(fā)科帶來的高能效AI實(shí)現(xiàn),又進(jìn)一步拓寬了我們對(duì)手機(jī)AI應(yīng)用的想象。
未來手機(jī)AI的新浪潮
事實(shí)上,智能手機(jī)對(duì)AI應(yīng)用的依賴程度,可能比我們想象得要更高。
就在前段時(shí)間,谷歌發(fā)布了最新的手機(jī)芯片Tensor。
相比于芯片性能和參數(shù),谷歌在Tensor中加入了大量的AI技術(shù)支持。
例如之前的智能通話、語音實(shí)時(shí)翻譯、照片去模糊、智能擦除等AI技術(shù),谷歌都將之直接集成到了手機(jī)芯片中,并以此作為芯片的核心亮點(diǎn)。
雖然Tensor芯片更多是被搭載在谷歌自身的Pixel 6和Pixel 6 Pro手機(jī)上,但它所透露出來的信號(hào)不言而喻。
很明顯,AI技術(shù)正在智能手機(jī)中占據(jù)著越來越重要的地位。
在硬件性能提升的同時(shí),如何讓手機(jī)盡可能搭載更多AI模型、如何合理對(duì)AI模型進(jìn)行融合來實(shí)現(xiàn)更多功能,正在成為智能廠商追逐的趨勢(shì)之一。

反過來看,更豐富的AI技術(shù),勢(shì)必又會(huì)對(duì)智能硬件本身提出更高的要求。
隨著AI愈發(fā)成為手機(jī)中勢(shì)不可擋的技術(shù)趨勢(shì),手機(jī)硬件也不應(yīng)當(dāng)只通過提升算力這一條路徑去提升優(yōu)化空間,而應(yīng)該聚焦于實(shí)際體驗(yàn),開辟如聯(lián)發(fā)科“高能效AI”這樣的更新思路。
換而言之,硬件不僅要去“適應(yīng)”AI技術(shù)本身,而是更應(yīng)當(dāng)理解AI背后的邏輯,并以此“延伸”AI技術(shù)背后的技術(shù)脈絡(luò)。
從發(fā)展路線來看,聯(lián)發(fā)科在“高能效AI”上,已經(jīng)進(jìn)行了相當(dāng)長時(shí)間的技術(shù)儲(chǔ)備,這一布局相比于一味提升峰值A(chǔ)I算力,更具實(shí)用價(jià)值:
包括天璣1000+在內(nèi)的多款天璣移動(dòng)平臺(tái)先后登頂蘇黎世AI-Benchmark的移動(dòng)芯片排行榜,同時(shí)在硬件架構(gòu)和軟件設(shè)計(jì)上,聯(lián)發(fā)科針對(duì)高能效這一方向進(jìn)行了不少自研技術(shù)優(yōu)化……
如今聯(lián)發(fā)科的下一代天璣旗艦處理器將要發(fā)布,隨著AI技術(shù)的演進(jìn),又會(huì)有怎么樣的顛覆性創(chuàng)新和升級(jí)?我們拭目以待。




