Hello，我是打败了李世石和柯洁的 AlphaGo

（图片来自网络）

近期，一个“Master”账号先后出现在弈城、野狐两个网站，横扫世界一流围棋高手，其中包括棋圣聂卫平、曾经吊打过李世石的柯洁及世界围棋八冠王古力。最后Master被证实为AlphaGo，并且是一个更强大、升级版的AlphaGo。

有两个事实着实微妙：
一是Master唯一的一场和局，是因为对手掉线，为什么不是Master？
一是人类非常无奈地意识到李世石在2016年3月赢下AlphaGo的一局，居然是人类赢下AI的最后一局。

一开始棋手们为尊严甚至为人类而战，而后不过短短几天，在强大的事实面前，我们开始接受，并思考如何通过与AlphaGo合作去解决更复杂的现实问题。正如谷歌董事长施密特所说无论输赢，都是人类的胜利。

AlphaGo本体

AlphaGo由谷歌旗下DeepMind公司的戴米斯·哈萨比斯、大卫·席尔瓦、黄士杰和与他们的团队开发。其主要工作原理是“深度学习”。“深度学习”是指多层的人工神经网络和训练它的方法。

AlphaGo通过两个不同神经网络“大脑”合作来改进下棋。

这些大脑是多层神经网络跟那些Google图片搜索引擎识别图片在结构上是相似的。

它们从多层启发式二维过滤器开始，去处理围棋棋盘的定位，就像图片分类器网络处理图片一样。

经过过滤，13 个完全连接的神经网络层产生对它们看到的局面判断。

这些层能够做分类和逻辑推理。能通过反复训练来检查结果，再去校对调整参数，让下次更好。这个处理器有大量的随机性元素，所以人们是不可能精确知道网络是如何“思考”的。

对人工智能来说，围棋游戏的难度在于，决策空间实在太大。决策(Decision Making)是人工智能的关键要素，使得机器能够在人类的世界中发挥作用。

人工智能的关键就是在决策空间中搜索达到最大效益的路径，最终体现在当前决策中。围棋棋盘上棋子可能的组合方式的数量就有10的170次方之多，超过宇宙原子总数。在近乎无穷的决策空间中，去暴力搜索出当前棋盘的下一步最优定子是绝对不可能的事情。

2006年一种叫做蒙特卡洛树的搜索法被发明，它使用概率模拟方法（类似模拟投掷骰子）只需要判断终盘胜负，弥补了围棋不能设定确定走法函数的缺陷。AlphaGo正是抛弃了暴力搜索，使用了蒙特卡洛树方法。

AlphaGo决策程序如下：

1. 走棋网络：给定当前局面，预测/采样下一步的走棋。
2. 快速走子：目标和1一样，但在适当牺牲走棋质量的条件下，速度要比1快1000倍。
3. 估值网络：给定当前局面，估计是白胜还是黑胜。
4. 蒙特卡罗树搜索：把以上这三个部分连起来，形成一个完整的系统。

AlphaGo背后的人类

AlphaGo的主要创造者是两个英国人，大卫·席尔瓦(David Silver)和戴米斯·哈萨比斯(Demis Hassabis)，他们是剑桥同学，专业都是计算神经科学。1998年毕业后，两人合开了一家电子游戏公司。

哈萨比斯经常和一名同事下围棋，席尔瓦在他的影响下也开始自学围棋。他们还加入了当地围棋俱乐部，和二三段棋手对弈，这是围棋中非常低的水平，两个高智商的家伙并不满足于此。他们忍不住思考，为什么电脑可以打败西洋跳棋、国际象棋的选手，却从未破解围棋。

2010年，哈萨比斯在伦敦成立了一个名为DeepMind的人工智能公司，席尔瓦随后而来，在这里他们开始了真正的人工智能之旅。这家公司之后被谷歌收购，这也解决了他们的资金问题。

在伦敦国王十字车站附近的DeepMind办公室中，AlphaGo的设计团队逐步形成。

团队概况见下：

戴米斯·哈萨比斯，人工智能企业家，DeepMindTechnologies公司创始人。4岁开始下国际象棋，8岁自学编程，13岁获得国际象棋大师称号。17岁进入剑桥大学攻读计算机科学专业。在大学里，他开始学习围棋。2005年进入伦敦大学学院攻读神经科学博士，选择大脑中的海马体作为研究对象。两年后，他证明了5位因为海马体受伤而患上健忘症的病人，在畅想未来时也会面临障碍，并凭这项研究入选《科学》杂志的“年度突破奖”。2011年创办DeepMind Technologies公司，以“解决智能”为公司的终极目标。

大卫·席尔瓦 （David Silver），剑桥大学计算机科学学士、硕士，加拿大阿尔伯塔大学计算机科学博士，伦敦大学学院讲师，Google DeepMind研究员。

黄士杰（Aja Huang），台湾交通大学计算机科学学士，台湾师范大学计算机科学硕士和博士，加拿大阿尔伯塔大学计算机科学博士后，Google DeepMind研究员。

除上述人员之外，阿尔法围棋设计团队核心人员还有DeepMind Technologies公司联合创始人施恩·莱格（Shane Legg）和穆斯塔法·苏莱曼（Mustafa Suleyman）等。

科技推动人类进步，同样科技也是把双刃剑。AlphaGo已来，AI正以超出认知的姿态强势介入，尽管恐慌难避，我们仍要说声：Hello，AlphaGo。

以上内容综合自百科、Vista看天下、新浪财经等。

上大咖说，约见ＡＩ大咖，走起！

--END--

大咖说是一个基于共享经济模式，连接公司和专家的新型顾问平台，致力于构建中国顶级的行业专家库。原则上，专家入驻标准是35岁以上、从业经验超过十年、公司职务VP（副总裁）以上，欢迎符合条件的您申请加入。

本站仅提供存储服务，所有内容均由用户发布，如发现有害或侵权内容，请点击举报。