DeepMind的新AI无需知道规则就能精通游戏

DeepMind 的最新 AI 无需知道规则就能精通游戏。该公司的研究人员在《自然》期刊上发表研究（预印本）报告了新 AI 算法 MuZero。

DeepMind 以打败围棋世界冠军的 AlphaGo 闻名，AlphaGo 利用了无数棋局进行训练。2017 年 DeepMind 推出了 AlphaZero，只需要知道基本规则就能自我训练精通游戏的 AI 算法。MuZero 则不再需要知道规则。它通过不断的试错去了解规则所允许的动作，同时了解特定动作所带来的奖励。它在此过程中不断学习找到更容易获得奖励的方法。通过同时学习规则和改进玩法。

MuZero 在数据利用效率超过了 AlphaZero 等前辈。研究人员正尝试将 MuZero 应用于视频压缩、自动驾驶和蛋白质设计。这一系统需要的算力非常多，但训练完成之后决策所需要的处理能力不需要多少，可以通过智能手机完成操作。儿童掌握知识的能力曾让很多人惊叹，语言学家 Noam Chomsky 曾主张儿童需要灌输语法知识否则难以掌握语言。这一观点受到越来越多的质疑。

来源

本站启用匿名评论，您可以在不透露邮箱/昵称 的情况下发布评论！

DeepMind的新AI无需知道规则就能精通游戏

Published by Oyasumi

One thought on “DeepMind的新AI无需知道规则就能精通游戏”

Leave a Reply Cancel reply