打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
通过游戏让 AI 更智能,科技巨头为什么都在这么做?

人工智能算法正从3D视频游戏中获益良多。——Davide Castelvecchi,《自然》杂志

 José Hernández-Orallo 是一名计算机专家,主要研究机器智能基准测量方法,他的孩子喜欢玩3D虚拟游戏《我的世界》,后来他发现这个游戏不是简简单单地打怪兽,而是引导玩家解决各种问题,于是,他把《我的世界》引入到他的研究中。

2014年,微软买下了《我的世界》视频游戏。起初,微软研究院仅向微软内部的研究人员发布了该游戏的一个新版本,这个新版本允许电脑程序和研究人员探索和按需定制3D环境。后来,微软邀请了一小部分包括 Hernández-Orallo 在内的外部研究人员下载这个游戏的定制版本。为了加速人工智能的发展进程,2015年7月,微软把这个游戏的定制版本向所有人免费开放。

现在,很多巨头也受到了微软的启发。12月3号,DeepMind 为方便外部开发人员下载和定制3D环境,向这些开发人员开放了他们自己的虚拟3D世界——DeepMind研究院。谷歌起初开发这个3D世界是为了训练他们自己的AI程序。紧接着两天后,OpenAI——由企业家Elon Musk在加利福尼亚州旧金山市创立的科研公司,发布了一个“元平台(meta-platform)”系统,这个平台使人工智能程序可以轻松地链接上许多3D游戏、浏览器以及手机程序。

微软、谷歌和OpenAI提供的开放测试环境,在最初的完全不可见的情况下,为研究者和开发者们的程序测试提供了更简便的方式。同时使程序在对类似现实世界场景的全新虚拟环境的探索中获取更多的新技能。西雅图华盛顿大学的机器学习研究者Pedro Domingos表示:“这样的开放环境对人工智能未来的发展意义重大”。

ATARI 算法

游戏作为人工智能的“测试床”已经有数十年了,但通常算法都是按照预定义的步骤来“玩”游戏的。近几年,研究焦点转向了能够从自身经验中完成自学的机器上。2015年初,DeepMind公布了一个算法,能在没有任何游戏目标的情况下,通过一次次实验和错误,教自己如何玩经典的Atari游戏,并且比所有人类玩家玩得都好。(译者注:Atari为一家美国游戏机厂商)

但是这些游戏都只是简单的2D游戏。第一人称的3D视频游戏,比如《我的世界》,这些在视觉上使玩家身临其中的游戏,是更接近现实世界的,所以也是更加复杂、精细的“测试床”。

《我的世界》能让用户操纵游戏中的虚拟砖块,来建造虚拟建筑,除此之外还能在游戏中游历的预置建筑,并与之互动。现在,向开发人员开放的游戏版本——Malmo,使算法同样能做到如此。举个例子来说,Hernández-Orallo正使用Malmo来探究一个环境能否用于为机器智能创建检验基准。算法之间会在把虚拟砖块堆砌成某个特定的建筑物的相似度上或是走出一个迷宫的速度上相互竞争。这相较于仅关注AI能否像人类一样聊天的“图灵测试”来说,这种测试方法考验了AI更多的技能。

将《我的世界》游戏改造成人工智能测试床的优势之一,就是它已经支持玩家间通过文字消息交流。Katja Hofmann——微软研究院的计算机专家,同时也是Malmo团队领导者对这一文字交流模式评价道:“这就使得人工智能可以与现实世界中的人类互动与合作。”

机器人的智能部分

Hofmann还表示,虚拟世界对开发那些最终注定要操控机器人的人工智能同样非常有用。因为这样的环境与现实世界相比,定制成本更低,并且操作更加安全、快捷。而且,虚拟世界还允许机器人研究人员仅关注方程式中的智能部分,因为机器人机械部分的实现难题往往会使研究人员分心。

除Hernández-Orallo之外,微软研究院与许多使用Malmo项目的研究院都有合作。但是Hofmann估计,除了与微软合作的研究院以外,实际还会有更多(数量大约在100间)研究院都在使用Malmo。

DeepMind研究院同样也允许其研究人员在测试场景中建造类似迷宫的建筑,他们的算法能够收集游戏奖励并且进行迷宫导航。DeepMind的一位女发言人说,他们现在还在尝试将更多的大自然元素(比如高低起伏的地形或是不同种类的植物)整合进他们的平台中。这位发言人还表示,现在既然业内整体环境和资源更加开放了,谷歌希望其他研究人员能够帮助设计对算法来说更具挑战性的环境。“通过开放资源,我们希望更多研究团体能参与共同打造这个更富挑战性的测试环境”。

值得一提地是,OpenAI发布的“元平台”做到的远不止开放环境。通过为同一个人工智能系统设置多个、完全不同的测试环境,OpenAI可以帮助攻克AI领域内最困难的问题之一——创建一个在面临新问题时,能够灵活运用之前经验的算法。举个例子来说,尽管深度神经网络(一种模仿人脑视觉皮质工作机制的算法)能非常讯速地学会导航一个3D迷宫,但是它并不能把这个导航的经验转换至另一个3D迷宫的导航中。Hernández-Orallo说“就算你只改变了迷宫的颜色,系统也会在迷宫中彻底‘迷路’,最先进、智能的科技对此也无能为力。”

微软现在正努力让Malmo在全世界普及。OpenAI的创始人和首席技术总监Greg Brockman也提出:“一个开放的生态平台将会加速人工智能的发展。”

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
DeepMind的人工智能现在可以玩全部57款雅达利游戏,但它还不够万能
人工智能要逆天!谷歌AI自学完成超难的雅达利游戏
【深度】专业解读“深度强化学习“:从AlphaGo到AlphaGoZero
完爆阿尔法狗元,DeepMind用5000台TPU训练出新算法,1天内称霸3种棋类
【重磅揭秘】击败李世石后,AlphaGo 的下一步是什么?
AlphaGo人工智能创始人演讲PPT(重磅)
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服