日前,騰訊開悟”平臺宣布正式開放王者榮耀AI開放研究環(huán)境”申請,邁出全面開放的第一步。面向非商業(yè)用途的機器學(xué)習(xí)算法研究,開悟”平臺將提供業(yè)界獨有的高復(fù)雜度MOBA訓(xùn)練環(huán)境,助力相關(guān)學(xué)術(shù)領(lǐng)域的前沿探索。
最新開放申請的王者榮耀AI開放研究環(huán)境”,包含了王者榮耀1v1對戰(zhàn)環(huán)境與baseline算法模型,當前支持20位英雄的鏡像對戰(zhàn)任務(wù)以及非鏡像類對戰(zhàn)任務(wù),尤其適合研究競爭性強化學(xué)習(xí)中的泛化性與通用性問題。
現(xiàn)在,研究者只需在騰訊開悟平臺官網(wǎng)注冊賬號、提交資料并通過平臺審核,即可免費下載王者榮耀1v1測試環(huán)境gamecore,在本地進行AI相關(guān)研究測試。
騰訊介紹稱,在《王者榮耀》對戰(zhàn)中,雙方玩家互為競爭關(guān)系,需要收集資源的同時干擾對方,以達到贏得游戲的目的。作為一個具備多英雄、多玩法的復(fù)雜對抗游戲,王者榮耀的狀態(tài)、動作空間復(fù)雜度比圍棋等游戲高很多,是學(xué)術(shù)屆研究復(fù)雜控制類問題的優(yōu)質(zhì)環(huán)境。
本次最新開放申請的王者榮耀AI開放研究環(huán)境”在只考慮雙方英雄選擇條件下,支持400種對戰(zhàn)子任務(wù),如果算上召喚師技能,將會有40000種子任務(wù),這對模型的泛化性有很大挑戰(zhàn),所以尤其適合研究競爭性強化學(xué)習(xí)中的泛化性與通用性問題。
2021年起,開悟”先后與北大、清華、中科大等19所國內(nèi)頭部高校教師團隊聯(lián)合發(fā)起創(chuàng)新課程合作項目,已于多所高校陸續(xù)落地多智能體強化學(xué)習(xí)實踐課程,幫助學(xué)生通過更有趣的方式掌握機器學(xué)習(xí)、強化學(xué)習(xí)、多智能體決策等關(guān)鍵知識點。
(舉報)