好消息!
腾讯AI足球队夺得世界冠军。
这是谷歌研究院与英超曼城俱乐部在Kaggle平台上联合举办的11v11足球人工智能竞赛。
由于既具有挑战性又有趣,一经推出就吸引了国内外团队的热情参与。截至12月中旬,已吸引来自世界各地的1100余支团队参赛,其中不乏来自世界顶尖大学和研究机构的实力雄厚的科研团队。 。
最终——腾讯AI实验室绝物WeKick版(以下简称“绝物”)以1785.8的成绩获得冠军,与其他队伍相比优势非常明显。
恭喜“绝物”团队取得优异成绩!
等等,《绝无》……这不是王者荣耀里的AI吗?
是的。他也擅长足球。
我们看到的足球比赛是这样的:
在AI眼中,它是这样的:
(AI的世界就是这么平淡无趣)
比赛中使用的Google Research Football环境是基于开源足球游戏Gameplay Football开发的强化学习环境。
外观很简单,但就像一场普通的足球比赛一样。有短传、长传、直塞球、射门和铲球。
(实际上,为了节省计算资源,大多数比赛都不是3D渲染的。)
比赛绝对公平、公正。
游戏场景是完全对称的。双方都有相同的球员。主客场比赛或状态之间没有数值差异。不设替补,不设加时赛,进球多者为胜(否则为平局)。
规则也与普通足球比赛类似——比赛分为两半场(每半场45分钟,1500步,每队开球一次),目标是将球踢入对方球门。
好了,游戏开始:
对手一开始就势头强劲。 10号将球传给插在中间的5号。他将球抽射入网。
《绝乌》0:1先丢一分。
可以看出,游戏中的每个玩家都由一个单独的智能代理控制。参赛队伍需要实时选择并控制其中一个智能体,与其他内置智能体进行配合。
因此,每个玩家不仅需要观察对手的行为,还需要关注自己玩家的情况。这需要非常复杂的团队合作和竞争策略。
由于法庭动态瞬息万变,还需要高速、实时的决策能力。
(哎呀,在这个解释过程中,绝乌又丢了一个球)
“绝无”以0:2落后两分。
但这并不重要。好在决武有着极为丰富的团战经验。
我们七、八、九队互相配合,率先扳回一分。
紧接着,我们五号乘胜追击。接到9号的精彩传球后,射门底角。
甚至! 《绝物》2:2。
赛点来了!我们的10号直接把球推到了中路,8号跑了回来,打进了致胜一球。
最终,“绝悟”以3:2获胜!
踢球的“绝物”和打王的“绝物”是一回事吗?
答:是的!
和大多数参赛队伍一样,“绝物”主要使用强化学习和自对弈(Self-Play)从头开始训练模型。
其训练的基础架构是基于《绝物》完整架构进行迁移的。详情请参阅
在此基础上,腾讯AI Lab对足球任务框架进行了针对性改进,使其能够适应11智能体足球比赛训练环境。
...(这次省略20218888字)
这也证明了腾讯AI Lab开发的“绝物”底层架构和方法的通用性。可以预见,此类方法未来有望进一步迁移到机器人等更多领域,从而创造更大的实用价值。
从围棋AI“决一”到战略决策AI“决武”,再到如今的AI足球队决武WeKick版本,腾讯AI Lab的深度强化学习智能体一步步进化,逐渐变得更加复杂多样的问题迁移,每一次进步都让我们离通用人工智能的终极目标又近了一步。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请联系本站,一经查实,本站将立刻删除。如若转载,请注明出处:http://ev829.com/html/tiyuwenda/14252.html