网易互娱AI Lab的Athena AI在国际强化学习顶级赛中夺冠
上证报中国证券网讯(记者 罗茂林)近日,在NeurIPS会议上举办的MineRL 2021 Diamond Competition落下帷幕,来自网易互娱AI Lab的Athena AI凭借高超的挖钻技巧,在以《我的世界》游戏为竞技环境的比赛中拿下Intro赛道的冠军以及Research赛道的亚军。这是AI第一次在《我的世界》中挖掘到钻石。
据悉,该比赛由CMU、OpenAI、DeepMind、Microsoft Research等机构联合举办,是强化学习方向最负盛名的比赛之一。比赛自2019年起,每年在机器学习和计算神经科学领域顶级学术会议NeurIPS上举办,今年为第三届。近年来该比赛吸引了包括腾讯AI Lab以及清华、北大、斯坦福大学等在内的众多工业界和学术界的相关研究人员。
据了解,MineRL比赛要求参赛者在《我的世界》游戏生存模式中,训练出一个能够从零开始收集各种资源、制作工具最后挖到钻石的智能体。比赛划分为Intro和Research两个赛道,其中Intro赛道的比拼更加贴近游戏AI开发中的真实场景,需要参赛者根据游戏特性设计针对性的算法,最大限度地提升AI水平。
相关业内人士向记者表示,这一比赛对于AI训练有四大难点,“首先是开放世界里巨大的动作空间和状态空间,其次是游戏设定的复杂工具链,这两大要素使得传统AI训练中,遍历穷举的算法无法施展,必须提升AI学习模型”,该人士表示,除此之外比赛还考验AI的长期规划能力以及有限数据下的学习能力,“官方提供的能提供给AI的数据有限且不完美,这要求AI学习模型的效率要提高。”
“这次网易团队另辟蹊径,放弃了依赖主办方提供的人类数据,没有采用分层强化学习等主流思路,而采用端到端的纯强化学习方案”,据一位网易内部人士透露,此次比赛中,网易训练的Athena AI通过合理地约束有效动作,达到了对状态的搜索空间进行剪枝的目的,使得AI在不使用分层策略的情况下,依然能够高效地达成目标。
据了解,网易互娱AI Lab成立于2017年,隶属于网易互动娱乐事业群,是游戏行业领先的人工智能实验室。AI Lab所提供的人工智能服务包括计算机视觉、自然语言处理、语音信号处理、游戏AI多个方面。作为智能AI系统,网易互娱AI Lab研发的Athena AI目前已经落地应用于网易互娱旗下的多款游戏。