通用AI:DeepMind提出了前进的道路

这篇文章最初发表在我们的姊妹网站Freethink.deepmind上创建了一个虚拟游乐场,该游乐场显示了创建一般AI的道路 – 人工智能的圣杯。rein

这篇文章最初发表在我们的姊妹网站Freethink上。

DeepMind创建了一个虚拟游乐场,该游乐场显示了创建一般AI的道路 – 人工智能的圣杯。

强化学习:如果您想训练AI下棋,则可以设置虚拟棋盘,列出规则,并让AI通过试用和错误学习游戏。

当它做一些“正确”的事情,例如捕获典当时,您会给它一个奖励。当它做主要正确的事情(例如赢得比赛)时,您会给它一个更大的回报。

最终,人工智能将学习获得最大的回报,而繁荣,您有一个可以击败国际象棋任何人的人工智能。

“这标志着迈向创建更多普通代理的重要一步。”

深态

挑战:这个过程称为强化学习,它是培训AIS的最有效方法之一。但是,它有一个主要的限制:在培训结束时,AI只知道如何做一件特定的事情。

即使试图训练一个知道如何做那件事(国际象棋)来做类似的事情(例如shogi,又名日本国际象棋)的人工智能也需要从头开始启动强化学习过程。

通用AI:拥有一个可以使用其智能解决各种问题的将军AI将是有用的,包括像人类一样从未见过的问题,就像人类一样。

不过,AI将军目前不存在,因为没有人弄清楚如何教机器在没有专门培训的任务中取得成功。

从理论上讲,我们可以一次对所有任务进行培训,但这需要大量的培训数据和时间,以至于根本不可行。

欢迎来到Xland:Google Sister Company DeepMind现在强调了通往一般AI的潜在途径。它设计了一个名为“ Xland”的虚拟世界,AI特工可以在其中浏览看起来像Mario Kart的战斗课程的环境。然后,它构建了一种算法,该算法可能会创建数十亿个不同的游戏式任务,以便在Xland中完成AIS。

代理人正确地完成任务,就像在标准的强化学习环境中一样,获得了奖励,并且每个新任务的设计都足以使代理商学习新事物。

结果:在研究结束时,AIS能够完成一系列任务,并可以快速掌握游戏,从而使新的AIS从头开始训练。

DeepMind在博客文章中写道:“我们发现代理商展示了一般性的启发式行为,例如实验,广泛适用于许多任务,而不是专门针对个人任务的行为。”

它继续说:“这种新方法标志着创建更普通代理的重要一步,以灵活的环境不断变化的灵活性。”

接下来的步骤:要明确,DeepMind的代理商不是通用的AI,但是与使用传统的,狭窄的强化学习训练的AIS相比,它们更全面解决问题。

这意味着,研究人员论文中详细介绍的算法方法(仍然需要进行同行评审)可能是我们可以创建更有能力的未来AIS的方式。

原创文章,作者:乐观兔,如若转载,请注明出处:http://www.dsonekey.com/3015.html

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注

联系我们

400-800-8888

在线咨询:点击这里给我发消息

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息