王者荣耀AI论文首曝光:AI王者局开黑与人类打平

王者荣耀

王者荣耀

  文章来源:夏乙 问耕 发自 凹非寺

  量子位 出品 | 公众号 QbitAI

  王者峡谷可能马上要被AI支配了!

  腾讯刚刚发布的一篇论文显示,王者荣耀AI在不声不响间,又掌握了新的技能:组团开黑。而且战绩不俗。

  5个各自独立的王者荣耀AI学会开黑技能后,5v5对阵《王者荣耀》王者段位人类玩家,大战250局,一举拿下48%的胜率,几乎可算战成平手。

  不得了。

  上个月,王者荣耀体验服开启了困难等级的人机练习模式测试,据说机器人只有铂金段位的水平,然而已经让一票大牛觉得不好打。

  现在王者段位水准的AI已经出现了,就问你怕了没。

  王者荣耀AI难在哪里

  腾讯去年就隐隐约约的透露在搞王者荣耀AI。

  有时说得“明目张胆”,有时又显得有点“遮遮掩掩”。去年,腾讯高管就曾透露下围棋的绝艺,正在尝试学打王者荣耀。

  在最新披露的论文里,腾讯表示虽然AlphaGo已经是AI里程碑,但下围棋与现实世界相比,仍然是一个非常简单的问题。

  更复杂的问题是实时战略(RTS)游戏,而其中最受欢迎的分支是MOBA游戏,包括Dota、英雄联盟以及王者荣耀等等。

王者荣耀AI论文首曝光:AI王者局开黑与人类打平

  一局王者荣耀平均时长20分钟,大约相当于2万帧。

  围棋一局通常不超过361手。

  在每一帧画面中,玩家需要在数十个选项中作出决定,包括有24个方向的移动键,以及一些技能键,有的技能键还有方向。及时经过大幅简化和离散化,以及把响应时间增加到200ms,动作空间的数量级仍有101500。

  而围棋的动作空间约为10250。

  至于状态空间,王者荣耀地图的分辨率是130000×130000像素,每个英雄的大小是1000像素。在每一帧,每个英雄都有不同的状态,如血量、等级、经济等等。即便经过大幅简化,状态空间仍有1020000。

  总结如下表,两个字:复杂。

王者荣耀AI论文首曝光:AI王者局开黑与人类打平

  王者局5v5开黑战绩亮眼

  即便这么复杂,腾讯还是取得了突破。

  来看看AI是怎么打农药的。

  先看看开局,这是最重要的阶段之一。下面的四张注意力分布图,这些代表着AI学会的不同开局策略。四张图从左到右,分别是:貂蝉(法师)、韩信(刺客)、亚瑟(坦克)和后裔(射手)。

王者荣耀AI论文首曝光:AI王者局开黑与人类打平

  可以看到,AI貂蝉在开局阶段重点关注中路外塔,AI韩信关注本方上路野区蓝Buff,AI亚瑟和AI后裔关注本方下路野区红Buff。没有列入的第五个英雄AI宫本武藏,会去守卫本方上路的外塔。

  这就是一个王者荣耀的常见开局。

  随着游戏的推进,AI对走位的注意力也会逐渐发生变化。通过下面这个图表可以看到,随着时间的推移,AI各个英雄之间的走位也会越来越近。

王者荣耀AI论文首曝光:AI王者局开黑与人类打平

  这种分工联动是这次王者荣耀AI最大的提升之处。

  说结果。升级之后的王者荣耀AI,为了验证自己的实力,开始找人类练手。五个AI组队开黑,与人类玩家5v5大战250局。最后,AI战队的胜率达到了48%。

  这些玩家都是王者段位,属于人类玩家中Top 1%那一部分。

  腾讯在论文中表示,AI战队取得的人头数,比人类战队少15%;而在推塔、团战率和经济获取方面,与人类战队相当。

  在开局前10分钟,AI战队比人类战队要多推掉2.5个塔。10分钟之后,由于团战能力较弱,双方的推塔数量逐渐接近。这个特点被腾讯归纳为:AI在宏观战略的制订方面,已经接近甚至优于人类高手。

王者荣耀AI论文首曝光:AI王者局开黑与人类打平

  王者AI背后的算法

  AI逼平人类王者,靠的是什么手段?

  答案是,一个基于学习的分层宏观策略(Hierarchical Macro Strategy)模型。经过这个模型的熏陶,控制每个英雄的智能体就既能独立做出决策又不忘与队友沟通,成为顶尖选手。

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:http://sol-melia.com/a/jingyan/9.html