20+頂尖高校同時開打《王者榮耀》!實際上是一場科研battle,你能信?
還是導師支持的那種
金磊 假裝發自 王者峽谷
量子位 報道 | 公眾號 QbitAI
不是吧,不是吧。
一群學霸聚集在一起,竟然是為了打《王者榮耀》?!
而且還是來自清北、中科院、浙大等20余所頂級學府的那種。
但畢竟是一幫學霸們的“聚會”,果然連打游戲的“姿勢”都那么與眾不同:
他們竟然要用《王者榮耀》搞科研!
(妥妥的是有種諸葛亮“黃金分割率”的味道了。)
這到底是怎么一回事?
在《王者榮耀》里搞科研
要想搞清楚這件事,就需要先來顛覆一下你對《王者榮耀》的認知。
友友們,其實它不單單是一款游戲那么簡單:
還是一個極具科研價值的游戲環境。
更準確來說,《王者榮耀》背后是一個AI 開放研究平臺,它背靠騰訊各方面資源優勢,為學術研究和算法開發開放的研究與應用探索平臺——
“開悟”。
但搞科研嘛,算法、算力、數據、場景,可以說是缺一不可。
于是“開悟”就放話了:
各路英雄豪杰,我這兒啥都有!
比如《王者榮耀》提供了游戲測試環境、脫敏游戲數據集,還有游戲核心集群等資源。
騰訊AI Lab則把搭建好的算法、計算平臺、評估工具亮了出來;算力的支持則是由騰訊云計算提供。
于是乎,來自各大頂尖高校的學霸們,就華山論劍般地匯聚于此。
至于各家高手們的“論劍之道”,就是在限定時間和資源內,訓練出最優模型,并把它部署到AI服務器當中。
在提交系統之后,學霸們就相當于“煉”出了他們各自的《王者榮耀》英雄。
這不,同樣是貂蟬,在修煉完不同“功法”后,便展開了一場激烈的博弈。
在1級狹路相逢之際,便來了個同歸于盡。
△ 注:動圖來自2021高校聯賽AI表演賽
雖說都只是智能體,但在這波battle中,她們很好地發揮了自身的基本功:
作戰中……
預測敵方走位……
已擊殺,陣亡……
每個基本功背后,都是智能體在“審時度勢”后的最佳決策。
而在雙方復活之后,策略之間的博弈就變得更加緊湊和激烈。
畢竟常言道:一招棋錯,滿盤皆輸
藍方貂蟬在入場發覺自己經濟較低,果斷選擇“發展我方經濟”。
但同時也沒有做到過分“猥瑣發育”,還是該出手時就出手——發起進攻、持續進攻。
△ 注:動圖來自2021高校聯賽AI表演賽
而在后期的決策博弈更是精彩:
戰略撤退、進攻防御塔、返回基地、追擊地方……
很是有種人類玩家的感覺了。
不僅如此,智能體在緊張的戰斗決策同時,還兼顧了出裝策略。
大家都知道,出完血書(血族之書)的貂蟬,戰斗中的續航能力會得到大幅提升。
為此,藍方貂蟬第二個法術大件果斷選擇夢魘之牙,以此來克制紅方貂蟬的回血。
△ 注:動圖來自2021高校聯賽AI表演賽
紅藍貂蟬在交手“八百回合”之后,終于迎來了“決戰紫禁之巔”的時刻。
在紅方水晶之下,兩位貂蟬紛紛喊出“花開了,怒放吧”開啟大招,完成最后的較量。
最終,以雙方紛紛倒地,由藍方小兵推倒紅方水晶結束戰斗。
……
這就是學霸們在《王者榮耀》里搞科研的結果展示。
而更具體一點來說,就是在特定的環境中,對多智能體之間的博弈展開研究,屬于強化學習領域范疇。
它的難點之一,就在于智能體的每一個決策與動作,都會對全局產生非常復雜的變化,是有種“牽一發而動全身”的感覺了。
而在剛才的例子中,只是展示了學霸們在1V1場景中的科研成果,但其實他們還會有3V3的戰斗。
這種場景對于智能體的挑戰就更高了,因為每個智能體僅能獲取局部的觀測信息,但無法得知其他“隊友”或“敵人”的信息。
這就對合作與競爭、完成特定任務背后的算法,提出了高難度的要求。
果然,學霸們打個游戲都是如此燒腦。
……
不過講真,如此“名場面”還真不是什么新鮮事。
游戲中搞科研,并不是第一次
其實剛才學霸們的“科研展示”,就是去年中科大和電子科大,在第一屆*騰訊“開悟”AI大賽上演的一場決斗。
這場比賽可以說是擴大了社會各界對“AI+游戲”的認知。
但說實話,在游戲里搞科研這件事,國內外早就有所行動了。
例如早在2017年,OpenAI“修煉”的智能體,就單挑苦練了半輩子Dota的人類玩家Dendi,最終AI大獲全勝。
時隔一年(2018年),OpenAI再次派出OpenAI Five,以5V5模式對戰人類頂級陣容。
結果,又是以AI100%勝率告終比賽。
當時這樣的結果簡直是出乎觀眾的意料之外,就連馬斯克在比賽前被問及“誰會贏”,都非常自信地回復到“人類”。
與此相關的技術論文也早就有所公布。
而除了在Dota2這種5V5團隊競技類型游戲外,“AI+游戲”在其他類型的游戲中也有所滲透。
例如DeepMind從2017年開始,也頻繁曝出在《星際爭霸2》這款游戲中碾壓人類頂級玩家的消息。
DeepMind在這方面的科研研究——AlphaStar,其背后的相關技術論文,更是登上了頂刊Nature。
而在國內,對于“AI+游戲”的科研也是如火如荼地進行中。
例如早在2018年開始,騰訊AI Lab便在《王者榮耀》中持續發力,并與游戲團隊打造出了策略協作型AI“王者絕悟”。
要知道,類似于這樣的5V5 團隊競技游戲,單是玩家的動作狀態空間便高達1020000。
這個數字遠遠大于圍棋及其他簡單游戲,甚至超過整個宇宙的原子總數(1080)。
在這三年期間,騰訊AI Lab在與之相關的研究,更是頻頻登上了AAAI、NeurIPS 等 AI 頂級會議(相關鏈接附在文末,感興趣的讀者可深入研究)。
而就在前不久的世界人工智能大會中,“王者絕悟”更是以全英雄達到職業電競水平亮相。
在與人類頂級選手的較量中,更是以絕對的勝率驚艷四座。
值得一提的是,正是由于騰訊AI Lab在“AI+游戲”領域的技術沉淀,才能夠在將其能力“打包”輸送給高校的學霸們,也就是我們剛才提到的“開悟”AI開放研究平臺。
……
至此,或許你有一個大大的疑問:
在游戲里搞科學研究,對我們現實生活有什么意義嗎?
直接上答案——有的!而且意義非凡。
游戲,會是下一個AI里程碑的誕生地嗎?
是的,這就是業界目前普遍認同的一種看法:
下一個AI里程碑可能會在復雜策略游戲中誕生。
這種說法并不是空穴來風。
首先,“AI+游戲”所涉足的大領域,便是強化學習。
一般來說,強化學習是用于描述和解決智能體在與環境的交互過程中,通過學習策略以達成回報最大化或實現特定目標的問題。
而一些復雜的強化學習算法,更是在一定程度上具備了解決復雜問題的通用智能。
但要通過訓練,讓智能體“煉就”如此能力,正如我們剛才說到的,算法、數據、算力、場景,這四樣缺一不可。
尤其是場景和數據,需要夠復雜、夠具備不確定性,才能更好的貼近真實世界中人類決策時面對的環境。
游戲場景,恰恰就是符合這些高要求的“陣地”。
因此,長遠來看,“AI+游戲”研究將是攻克通用人工智能(AGI)的關鍵一步。
而之于現實意義,以近幾年大火的自動駕駛為例。
在這一領域中,隨著技術的不斷發展,自動駕駛逐步地從“感知層”向“決策層”過渡。
這是因為自動駕駛車輛在面臨突發、不確定性問題時,需要作出精準的決策,來避免意外的發生。
可以把一輛自動駕駛汽車想象為一個游戲中的智能體,當它在現實生活中運行時,所要面對的問題復雜度之高,就不言而喻了。
這就離不開通過強化學習方法的大量訓練,讓自動駕駛這個“智能體”的應變能力,能夠無限接近甚至超越人類。
但要練就這身功夫,在真實生活場景中訓練定然是不現實的,而游戲,就成了一個非常好的訓練場。
自動駕駛只是應用場景的案例之一,更多的還包括城市/空中交通管理、多機器人協調、能源分配等問題。
……
而騰訊AI Lab之所以攜手王者榮耀團隊打造“開悟”,也是基于上述情況的考量,不過他想要的做的卻更多:
推動多智能體強化學習的發展。
尤其是高校在這方面的研究,更是“硬性條件”上面臨著較為嚴峻的挑戰。
但開放“開悟”,僅僅是騰訊AI Lab和王者榮耀團隊為了完成這一目標的舉措之一。
據了解,開悟還攜手高校合作開發課程,進一步普及多智能體強化學習教育。
例如在今年8月,騰訊就宣布與四所國內一流高校(北京大學、電子科技大學、清華大學、中國科學技術大學),共建教學內容和課程體系改革項目。
據悉,這些頂尖高校將分別構建一門至少20學時的多智能體及強化學習平臺的專業課程,理論授課知識點包括但不限于機器學習、強化學習、多智能體決策等相關的知識點。
除此之外,騰訊“開悟”還聯合高校成立了人工智能科教聯盟,并攜手高校、科研院所、產業園區、投資機構組建人工智能科創聯合體。
正如《王者榮耀》執行制作人、騰訊天美L1總經理黃藍梟總結的那樣:
我們開放了《王者榮耀》核心機制,提供標準接口、核心算法、脫敏的測試數據、評估工具和計算集群等,給高校老師和同學們進行多智能體的機器學習算法研究、學習成果交流,對算法成果反復迭代升級。期待這些研究成果能夠落地其他產業環境,為工業機器人、救災機器人等提供助力。
……
讀到這里,你想不想圍觀清北等高校的學霸們,如何不僅打了游戲,還順便把科研也一塊搞了?
請繼續關注開悟平臺及賽事動向。
傳送門
開悟官網地址:
https://aiarena.tencent.com/aiarena/zh/index
絕悟相關論文地址:
Mastering Complex Control in MOBA Games with Deep Reinforcement Learning:
https://arxiv.org/abs/1912.09729
Hierarchical Macro Strategy Model for MOBA Game AI:
https://arxiv.org/abs/1812.07887
Supervised Learning Achieves Human-Level Performance in MOBA Games: A Case Study of Honor of Kings:
https://arxiv.org/abs/2011.12582
- 看完最新國產AI寫的公眾號文章,我慌了!2025-12-08
- 給機器人打造動力底座,微悍動力發布三款高功率密度關節模組2025-12-08
- 云計算一哥10分鐘發了25個新品!Kimi和MiniMax首次上桌2025-12-03
- Ilya剛預言完,世界首個原生多模態架構NEO就來了:視覺和語言徹底被焊死2025-12-06




