腾讯开悟「王者荣耀AI开放研究环境」启动申请,为学术研究提供探索平台

11月21日,腾讯「开悟」平台宣布正式开放「王者荣耀AI开放研究环境」申请,迈出全面开放的第一步。面向非商业用途的机器学习算法研究,「开悟」平台将提供业界独有的高复杂度MOBA训练环境,助力相关学术领域的前沿探索。

最新开放申请的「王者荣耀AI开放研究环境」,包含了王者荣耀1v1对战环境与baseline算法模型,当前支持20位英雄的镜像对战任务以及非镜像类对战任务,尤其适合研究竞争性强化学习中的泛化性与通用性问题。

研究者只需在腾讯开悟平台官网注册账号、提交资料并通过平台审核,即可免费下载王者荣耀1v1测试环境gamecore,在本地进行AI相关研究测试。

申请地址:

https://aiarena.tencent.com/aiarena/zh/open-gamecore   

「王者荣耀AI开放研究环境」项目发布以来受到广泛关注,今年 9 月以 264 星登上 Github月度热榜,同时,相关论文已被 AI 领域的顶级国际学术会议 NeurIPS 2022 接收。

论文链接:https://openreview.net/forum?id=7e6W6LEOBg3

代码链接:https://github.com/tencent-ailab/hok_env

随着王者荣耀游戏在持续运营中成长迭代,「开悟」平台也将逐步探索并开放更多适用于AI研究的游戏测试环境,为AI业界面临的「缺乏高挑战测试环境」难题提供全新解决方案。

高复杂度、高挑战性的智能体训练环境

在王者荣耀对战中,双方玩家互为竞争关系,需要收集资源的同时干扰对方,以达到赢得游戏的目的。作为一个具备多英雄、多玩法的复杂对抗游戏,王者荣耀的状态、动作空间复杂度比围棋等游戏高很多,是学术届研究复杂控制类问题的优质环境。

2019年,腾讯AI Lab首次发布决策智能AI「王者绝悟」的研究论文,介绍在王者荣耀1v1环境中研究用深度强化学习来为智能体预测游戏动作的方法,该论文被AAAI 2020接收,之后「王者绝悟」陆续攻克5v5挑战及全英雄池,在学术领域取得多项成就同时,也为王者荣耀玩家带来了「绝悟挑战」等创新玩法。

同年,王者荣耀及腾讯AI Lab联手打造「开悟」AI开放研究平台,打造游戏AI产学研新生态。如今「开悟」正式开放王者荣耀1v1环境,并对环境进行了易用性封装,提供标准代码与训练框架,让个人用户在资源允许的情况下可以轻松上手分布式训练。

本次最新开放申请的「王者荣耀AI开放研究环境」在只考虑双方英雄选择条件下,支持400种对战子任务,如果算上召唤师技能,将会有40000种子任务,这对模型的泛化性有很大挑战,所以尤其适合研究竞争性强化学习中的泛化性与通用性问题。

进一步看,研究模型对不同任务的泛化性,对降低AI在不同领域的应用成本至关重要。例如,面对测试环境中的多个任务,如何在有限的资源和时间条件下获得最好的效果,这其中的研究方法论和成果就可以迁移到其他领域,比如机器人不同部位的控制等。

「开悟」AI开放研究平台助力产学研,共享AI新生态

「开悟」是腾讯牵头构建的AI多智能体与复杂决策开放研究平台,依托「王者荣耀」和腾讯AI Lab在算法、算力、实验场景方面的核心优势,为学术研究人员和算法开发者开放的国内领先、国际一流研究与应用探索平台。

目前,「开悟」也正在持续助力AI学界人才培养。2019年至今,「开悟」AI 开放研究平台已成功主办两届「开悟多智能体强化学习大赛」、承办了成都大运会 「世界大学生数智竞技邀请赛」AI赛道,「以赛促研」为国内外青年研究人才提供测试及提升AI在复杂游戏场景下应用水平的机会。

2021年起,「开悟」先后与北大、清华、中科大等19所国内头部高校教师团队联合发起创新课程合作项目,已于多所高校陆续落地多智能体强化学习实践课程,帮助学生通过更有趣的方式掌握机器学习、强化学习、多智能体决策等关键知识点。

基于「开悟」平台,腾讯将与学界、业界携手,共同利用游戏环境不断提升AI能力,并寻找 AI 技术解决更多问题的可能性,在机器人、医疗、工业、交通等领域发挥更大作用。

资源下载: