从MineRL训练数据库在Minecraft中挖掘钻石所需的步骤示例

科技 | 2022-02-21 09:09:26

时间：2022-02-21 09:09:26 / 来源：网易阅读量：10465

一项新挑战测试人工智能通过观看学习的能力

无论我们是在学习煮煎蛋卷还是开车，掌握新技能的途径通常都是从观察他人开始的但是人工智能可以以同样的方式学习吗一项教 AI 代理玩Minecraft 的新挑战表明，这对计算机来说要复杂得多

今年早些时候宣布，MineRL 竞赛要求研究人员团队创建可以在Minecraft 中成功开采钻石的 AI 机器人这并非不可能完成的任务，但确实需要掌握游戏的基础知识玩家需要知道如何在躲避怪物和熔岩的同时砍伐树木，制作镐和探索地下洞穴这些是大多数成年人在经过几个小时的实验后可以掌握的技能，或者通过在 YouTube 上观看教程来更快地学习

但是，根据将在 AI 会议 NeurIPS 上公布的结果以及BBC 新闻首次报道的结果，在 MineRL 竞赛的 660 个参赛作品中，没有一个能够完成挑战尽管机器人能够学习中间步骤，例如建造熔炉来制造耐用的镐，但没有人成功找到钻石

我们提出的任务非常艰巨，帮助组织挑战的微软研究院首席研究员 Katja Hofmann 告诉BBC 新闻虽然没有提交的代理完全解决了任务，但他们已经取得了很大进展，并学会了制作沿途所需的许多工具

从 MineRL 训练数据库在Minecraft 中挖掘钻石所需的一些步骤示例。

这可能是一个惊喜，尤其是当你认为 AI 在国际象棋，围棋和Dota 2等游戏中已经成功地击败了人类但它反映了该技术的重要局限性以及 MineRL 评委为真正挑战人工智能而设置的限制团队

MineRL 中的机器人必须结合使用称为模仿学习和强化学习的方法进行学习在模仿学习中，智能体会看到他们前面任务的数据，他们会尝试模仿它在强化学习中，他们只是被扔到一个虚拟世界中，然后通过反复试验自己解决问题

通常，人工智能只能通过结合这两种方法来应对重大挑战例如，著名的 AlphaGo 系统首先通过输入旧游戏的数据来学习下围棋然后它通过一遍又一遍地玩自己来磨练自己的技能——并超越了所有人类

MineRL 机器人采用了类似的方法，但它们可用的资源相对有限虽然像 AlphaGo 这样的 AI 代理是用庞大的数据集，强大的计算机硬件和相当于数十年的训练时间创建的，但 MineRL 机器人必须只需要 1，000 小时的记录游戏玩法来学习，一个 Nvidia 图形处理器来训练，只需四天时间即可上手

这是 MLB 球队可用资源与少儿联盟球队必须使用的资源之间的区别。Minecraft更新不仅添加了地点功能。还修复了数十个错误，主要是在极其罕见的情况下，例如扭曲的藤蔓保护玩家免受跌落伤害，或失明让玩家在粉雪中看得更远。。

以这种方式束缚 MineRL 机器人似乎不公平，但这些限制反映了将 AI 集成到现实世界中的挑战虽然像 AlphaGo 这样的机器人肯定会突破人工智能可以实现的界限，但很少有公司和研究实验室可以与谷歌拥有的 DeepMind 的资源相匹敌

比赛的主要组织者，卡内基梅隆大学博士生威廉·古斯告诉BBC 新闻，这项挑战旨在表明并非每个人工智能问题都应该通过投入计算能力来解决Guss 说，这种心态直接反对这些强化学习系统的民主化访问，并将在复杂环境中训练代理的能力留给了拥有大量计算能力的公司

因此，虽然 AI现在可能在Minecraft中苦苦挣扎，但当它克服这一挑战时，它有望为更广泛的受众带来好处只是不要考虑那些可能失业的可怜的Minecraft YouTubers

。