參加動(dòng)物AI奧運(yùn)會(huì),讓你的智能體比狗狗聰明,掙取3.2萬美元獎(jiǎng)金
還有機(jī)會(huì)去NeurIPS。
曉查 發(fā)自 凹非寺
量子位 報(bào)道 | 公眾號(hào) QbitAI
AI已經(jīng)在很多方面戰(zhàn)勝人類,比如圍棋、星際爭霸游戲,人類已經(jīng)打不過AI了。但是在面對(duì)真實(shí)的生存環(huán)境時(shí),AI的表現(xiàn)有時(shí)還不如動(dòng)物。
烏鴉在喝不到水的時(shí)候,會(huì)向瓶子中扔石頭抬高水面。這就是生物智能的力量。
然而,有些動(dòng)物也會(huì)“犯傻”,比如一只狗狗銜著木棍,就不知道怎么通過一道門了。
AI智能體做得就比狗狗好,可見好好訓(xùn)練AI還是很有潛力的。
現(xiàn)在,有這樣一個(gè)舞臺(tái),可以讓你的智能體在模擬的野生環(huán)境中學(xué)習(xí)生存,就像動(dòng)物一樣。這就是來自帝國理工學(xué)院的研究助理開發(fā)的動(dòng)物AI奧運(yùn)會(huì)(Animal-AI Olympics)。
開發(fā)本次賽事的Benjamin Beyret拉到了不少大公司的贊助,總獎(jiǎng)金達(dá)到3.2萬美元,部分獲獎(jiǎng)?wù)邔@得參加NeurIPS 2019的差旅費(fèi)用,甚至有機(jī)會(huì)在NeurIPS上發(fā)表演講。
挑戰(zhàn)內(nèi)容
這場比賽將人工智能方法與動(dòng)物王國聯(lián)系起來,以確定人工智能的巨大成功現(xiàn)在是否已準(zhǔn)備好與他們自己游戲中的偉大成功進(jìn)行競爭。
智能體將在下面的競技場中接受生存挑戰(zhàn)。
目前這個(gè)場地已經(jīng)已經(jīng)完成了300項(xiàng)測試,比賽舉辦者公布了10個(gè)類別的挑戰(zhàn)。分別是:
1、食物:大多數(shù)動(dòng)物都受到食物的驅(qū)動(dòng),食品是環(huán)境中唯一的積極獎(jiǎng)勵(lì),每次測試的目標(biāo)是在時(shí)間用完之前盡可能多地獲取食物。
2、偏好:用于測試智能選擇最有價(jià)值的行動(dòng)方案的能力。幾乎所有動(dòng)物都會(huì)表現(xiàn)出對(duì)更多食物的偏好或?qū)ふ腋菀撰@得食物,有些動(dòng)物有能力對(duì)長期行動(dòng)做出復(fù)雜的決定。
3、障礙:比賽中包含可能阻礙智能體導(dǎo)航的不可移動(dòng)障礙。要在測試中取得成功,智能體可能必須學(xué)會(huì)探索環(huán)境。
4、回避:比賽中定義了熱區(qū)和死亡區(qū),如果被智能體觸及這些區(qū)域?qū)?huì)給予負(fù)面獎(jiǎng)勵(lì)。生物有機(jī)體具有一項(xiàng)關(guān)鍵能力是避免有害刺激。
5、空間推理:測試智能體更復(fù)雜的導(dǎo)航能力,以及運(yùn)行環(huán)境中的一些簡單物理知識(shí)。
6、概括:此類別包括可能看起來與代理表面不同的環(huán)境變體,即使問題的屬性和解決方案保持不變。這些仍由標(biāo)準(zhǔn)配置文件指定。
7、內(nèi)部模型:測試存儲(chǔ)存儲(chǔ)內(nèi)部環(huán)境模型的能力。在這些測試中,燈可能會(huì)在一段時(shí)間后關(guān)閉,并且代理必須記住環(huán)境的布局,在黑暗中導(dǎo)航。
8、對(duì)象持久性:許多動(dòng)物都明白,當(dāng)一個(gè)物體離開視線時(shí),它仍然存在。
9、高級(jí)偏好:此類別測試代理執(zhí)行更復(fù)雜決策的能力,以確保其獲得盡可能高的回報(bào)。
10、因果推理:包括提前計(jì)劃的能力,以便在采取行動(dòng)之前考慮行動(dòng)的后果。一些非人類動(dòng)物已經(jīng)通過了這一類別的所有測試。
獎(jiǎng)勵(lì)內(nèi)容
贊助本次比賽的7家廠商提供了以下豐厚獎(jiǎng)勵(lì):
- 19000美元現(xiàn)金獎(jiǎng)勵(lì)
- 3000美元旅行獎(jiǎng)勵(lì):有機(jī)會(huì)受邀參加2019年NeurIPS
- 10000美元的AWS信用額度
前三名的獎(jiǎng)勵(lì)是這樣的:
- 第一名:7500美元,包含6500美元和1000美元出席NeurIPS的差旅費(fèi)用
- 第二名:6000美元,包含5000美元和1000美元出席NeurIPS的差旅費(fèi)用
- 第三名:1500美元
還有WBA獎(jiǎng):
總價(jià)值5000美元,其中包括1000美元出席NeurIPS的差旅費(fèi)用
分類獎(jiǎng)金:
9月1日前20名參賽作品將獲得500美元的AWS獎(jiǎng)勵(lì),供比賽下半程使用。
比賽時(shí)間
比賽作品上傳時(shí)間從7月1日晚11:59開始,到7月8日晚11點(diǎn)59分結(jié)束(均為格林尼治時(shí)間)。
第一輪測試將于9月1日晚11:59進(jìn)行。
第二輪也是最后一輪測試階段將于11月1日晚11:59進(jìn)行。
大賽組委會(huì)
本次大賽的組委會(huì)有來自帝國理工、劍橋大學(xué)、DeepMind的多位學(xué)者。
傳送門
GitHub頁面有本次大會(huì)的詳細(xì)介紹:
https://github.com/beyretb/AnimalAI-Olympics
另外,參賽請(qǐng)戳鏈接:
http://www.animalaiolympics.com/




