打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
Hello,我是打败了李世石和柯洁的 AlphaGo

(图片来自网络)

近期,一个“Master”账号先后出现在弈城、野狐两个网站,横扫世界一流围棋高手,其中包括棋圣聂卫平、曾经吊打过李世石的柯洁及世界围棋八冠王古力。最后Master被证实为AlphaGo,并且是一个更强大、升级版的AlphaGo。

有两个事实着实微妙:

一是Master唯一的一场和局,是因为对手掉线,为什么不是Master?

一是人类非常无奈地意识到李世石在2016年3月赢下AlphaGo的一局,居然是人类赢下AI的最后一局。

一开始棋手们为尊严甚至为人类而战,而后不过短短几天,在强大的事实面前,我们开始接受,并思考如何通过与AlphaGo合作去解决更复杂的现实问题。正如谷歌董事长施密特所说无论输赢,都是人类的胜利

AlphaGo本体

AlphaGo由谷歌旗下DeepMind公司的米斯·哈萨比斯大卫·席尔瓦黄士杰和与他们的团队开发。其主要工作原理是“深度学习”。“深度学习”是指多层的人工神经网络和训练它的方法。

AlphaGo通过两个不同神经网络“大脑”合作来改进下棋。

这些大脑是多层神经网络跟那些Google图片搜索引擎识别图片在结构上是相似的。

它们从多层启发式二维过滤器开始,去处理围棋棋盘的定位,就像图片分类器网络处理图片一样。

经过过滤,13 个完全连接的神经网络层产生对它们看到的局面判断。

这些层能够做分类和逻辑推理。能通过反复训练来检查结果,再去校对调整参数,让下次更好。这个处理器有大量的随机性元素,所以人们是不可能精确知道网络是如何“思考”的。

对人工智能来说,围棋游戏的难度在于,决策空间实在太大。决策(Decision Making)是人工智能的关键要素,使得机器能够在人类的世界中发挥作用。

人工智能的关键就是在决策空间中搜索达到最大效益的路径,最终体现在当前决策中。围棋棋盘上棋子可能的组合方式的数量就有10的170次方之多,超过宇宙原子总数。在近乎无穷的决策空间中,去暴力搜索出当前棋盘的下一步最优定子是绝对不可能的事情。

2006年一种叫做蒙特卡洛树的搜索法被发明,它使用概率模拟方法(类似模拟投掷骰子)只需要判断终盘胜负,弥补了围棋不能设定确定走法函数的缺陷。AlphaGo正是抛弃了暴力搜索,使用了蒙特卡洛树方法。

AlphaGo决策程序如下:

1. 走棋网络:给定当前局面,预测/采样下一步的走棋。

2. 快速走子:目标和1一样,但在适当牺牲走棋质量的条件下,速度要比1快1000倍。

3. 估值网络:给定当前局面,估计是白胜还是黑胜。

4. 蒙特卡罗树搜索:把以上这三个部分连起来,形成一个完整的系统。

AlphaGo背后的人类

AlphaGo的主要创造者是两个英国人,大卫·席尔瓦(David Silver)和戴米斯·哈萨比斯(Demis Hassabis),他们是剑桥同学,专业都是计算神经科学。1998年毕业后,两人合开了一家电子游戏公司。

哈萨比斯经常和一名同事下围棋,席尔瓦在他的影响下也开始自学围棋。他们还加入了当地围棋俱乐部,和二三段棋手对弈,这是围棋中非常低的水平,两个高智商的家伙并不满足于此。他们忍不住思考,为什么电脑可以打败西洋跳棋、国际象棋的选手,却从未破解围棋。

2010年,哈萨比斯在伦敦成立了一个名为DeepMind的人工智能公司,席尔瓦随后而来,在这里他们开始了真正的人工智能之旅。这家公司之后被谷歌收购,这也解决了他们的资金问题。

在伦敦国王十字车站附近的DeepMind办公室中,AlphaGo的设计团队逐步形成。

团队概况见下:

米斯·哈萨比斯,人工智能企业家,DeepMindTechnologies公司创始人。4岁开始下国际象棋,8岁自学编程,13岁获得国际象棋大师称号。17岁进入剑桥大学攻读计算机科学专业。在大学里,他开始学习围棋。2005年进入伦敦大学学院攻读神经科学博士,选择大脑中的海马体作为研究对象。两年后,他证明了5位因为海马体受伤而患上健忘症的病人,在畅想未来时也会面临障碍,并凭这项研究入选《科学》杂志的“年度突破奖”。2011年创办DeepMind Technologies公司,以“解决智能”为公司的终极目标。

大卫·席尔瓦 (David Silver),剑桥大学计算机科学学士、硕士,加拿大阿尔伯塔大学计算机科学博士,伦敦大学学院讲师,Google DeepMind研究员。

黄士杰(Aja Huang),台湾交通大学计算机科学学士,台湾师范大学计算机科学硕士和博士,加拿大阿尔伯塔大学计算机科学博士后Google DeepMind研究员。

除上述人员之外,阿尔法围棋设计团队核心人员还有DeepMind Technologies公司联合创始人施恩·莱格(Shane Legg)和穆斯塔法·苏莱曼(Mustafa Suleyman)等。

科技推动人类进步,同样科技也是把双刃剑。AlphaGo已来,AI正以超出认知的姿态强势介入,尽管恐慌难避,我们仍要说声:HelloAlphaGo

以上内容综合自百科、Vista看天下新浪财经等。

上大咖说,约见AI大咖,走起!

--END--

大咖说是一个基于共享经济模式,连接公司和专家的新型顾问平台,致力于构建中国顶级的行业专家库。原则上,专家入驻标准是35岁以上、从业经验超过十年、公司职务VP(副总裁)以上,欢迎符合条件的您申请加入。

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
围棋“大师” 背后的科技力量
人工智能击败人类围棋大师:但远称不上超级智能(图)
谷歌阿尔法围棋AlphaGo背景资料照片 两个大脑介绍(图)
教育视界 | 人工智能带给教育的六大变革,老师你知道吗?
AlphaGo之父:一个有这一半华人血统的英国天才
AlphaGo背后的人脑有多强大?
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服