谷歌造了個虛擬足球場,讓AI像打FIFA一樣做強化學(xué)習(xí)訓(xùn)練丨開源
足球AI虛擬環(huán)境
郭一璞 發(fā)自 蘇州街
量子位 報道 | 公眾號 QbitAI
除了下棋、雅達利游戲和星際,AI終于把“魔爪”伸向了粉絲眾多的體育競技活動:
足球。
今天,谷歌開源了足球模擬環(huán)境Google Research Football,智能體可以在這個宛若FIFA的世界里自由踢球,學(xué)到更多踢球技巧。
用足球進行強化學(xué)習(xí)訓(xùn)練,對AI來說更有挑戰(zhàn)性,不僅要能控球,還得搞懂傳球、角球這些概念,知道什么時候會犯規(guī)吃紅牌黃牌,同時訓(xùn)練出足夠機智的策略。雖然AI足球沒有體能挑戰(zhàn),但智慧上的要求有增無減。
不少熱愛足球的網(wǎng)友看到之后都十分激動,終于能把自己的愛好和研究結(jié)合在一起了。
甚至還有人為中國足球請愿:求谷歌幫幫國足吧!
可以打人機的足球引擎
這個模擬環(huán)境基于開源的足球游戲模擬器Gameplay Football,用C++編寫,在GPU和CPU上都能跑。
整個環(huán)境包含一場球賽中的各種環(huán)節(jié),和正常的人類足球賽一樣,兩支隊伍各11名運動員,一個智能體可以控制一個球員,也可以控制一整只隊伍,雙方遵循正常的足球規(guī)則進行比賽。
比如可以開球。
射門。
還有裁判會給出判罰,智能體也可能吃紅牌黃牌。
必要的時候還得會踢角球。
整個模擬環(huán)境中,AI球員們可以進行包括上下左右移動、長傳、射門等在內(nèi)的16種動作。
甚至,AI球員們還會和人類一樣,踢久了就會累,你還能給每支球隊準(zhǔn)備3個題目。總之,這個模擬環(huán)境相當(dāng)完備,具備各種功能和規(guī)則體系。
而且操作也十分方便,你可以直接用API把OpenAI Gym接入進來。
而且,整個模擬環(huán)境中不僅可以用AI球員,還可以手動控制球員,用鍵盤上下左右移動,按字母鍵進行傳球、射門等操作,與AI對戰(zhàn)。
模擬環(huán)境內(nèi)置了高中低三個難度的對手AI,也可以自行調(diào)整難度。當(dāng)然你也可以把兩個自己的AI放進去,讓他們互相傷害。
benchmark
Google不只準(zhǔn)備了模擬環(huán)境,還為這個AI足球設(shè)定了一套benchmark。
谷歌用DQN和Impala兩個強化學(xué)習(xí)算法在模擬環(huán)境中測試,將它們的獎勵均設(shè)定為進球得分,在高中低三個難度上得到了運行結(jié)果。
足球?qū)W院
另外,為了讓AI專點突破,Google還推出了足球?qū)W院(Football Academy),針對各種難度場景進行單獨訓(xùn)練。
包括傳球策略
隊友配合
碰到2打1怎么辦
角球得分訓(xùn)練
傳送門
Google AI博客:
https://ai.googleblog.com/2019/06/introducing-google-research-football.html
論文下載地址:
https://github.com/google-research/football/blob/master/paper.pdf?raw=True
GitHub:
https://github.com/google-research/football



