DeepMind的新AI无需知道规则就能精通游戏

DeepMind 的最新 AI 无需知道规则就能精通游戏。该公司的研究人员在《自然》期刊上发表 研究(预印本)报告了新 AI 算法 MuZero。

DeepMind 以打败围棋世界冠军的 AlphaGo 闻名,AlphaGo 利用了无数棋局进行训练。2017 年 DeepMind 推出了 AlphaZero,只需要知道基本规则就能自我训练精通游戏的 AI 算法。MuZero 则不再需要知道规则。它通过不断的试错去了解规则所允许的动作,同时了解特定动作所带来的奖励。它在此过程中不断学习找到更容易获得奖励的方法。通过同时学习规则和改进玩法。

MuZero 在数据利用效率超过了 AlphaZero 等前辈。研究人员正尝试将 MuZero 应用于视频压缩、自动驾驶和蛋白质设计。这一系统需要的算力非常多,但训练完成之后决策所需要的处理能力不需要多少,可以通过智能手机完成操作。儿童掌握知识的能力曾让很多人惊叹,语言学家 Noam Chomsky 曾主张儿童需要灌输语法知识否则难以掌握语言。这一观点受到越来越多的质疑。

来源


本站启用匿名评论,您可以在不透露 邮箱/昵称 的情况下发布评论!


评论

《“DeepMind的新AI无需知道规则就能精通游戏”》 有 1 条评论

  1. 有赛博朋克那味了

发表回复