【安信计算机】朋友圈刷屏的人机围棋大战究竟是什么？

2016-02-01 15:58 文 / 胡又文|安信证券已阅 27493

编者按：安信证券研报指出，谷歌旗下的DeepMind团队研发的人工智能算法击败欧洲围棋冠军Fan Hui，是在迈向更类似人类直觉的人工智能道路上的里程碑事件，展现了人工智能的巨大潜力。人工智能也被中国科技界视为实现弯道超车的一次难得的历史机遇，继续坚定看好人工智能这一未来最重要的产业方向。

一、Deepmind缔造人工智能里程碑事件：AI战胜欧洲围棋冠军

2016年初，谷歌DeepMind团队在最新一期《Nature》上发表论文称，他们研发的人工智能算法击败了欧洲围棋冠军Fan Hui，同时也击败了目前最好的围棋程序中99.8%的对手，这是在迈向更类似人类直觉的人工智能道路上的里程碑事件，意义重大。

为什么围棋一直是人工智能挑战的难点？

对计算机来说，在围棋领域战胜人类比在象棋等其他领域的挑战更大，主要原因有二点：

第一，每个回合可能存在的走法数量多得多。在国际象棋的任何一个回合，平均可能的走法有35种。但围棋的走法却能达到250种，并且在这250种可能的走法之后，还对应着另外250种可能，因此传统的遍历搜索去计算每一步走法所带来的所有结果是不可能的。

第二，没有一个简单的方法来评判每一步棋的优势。在下围棋时，即使是最高段的棋手也无法检查出每一步走法所带来的所有结果，所以棋手只能学着在棋盘上几百个棋子中识别出抽象模式，即使是专家也经常会很难解释为什么一步棋看起来很有优势或有问题。

因此围棋作为一项非常困难的任务，是一个来验证包括模式识别、问题解决和规划各种机器学习技能结合的很好案例，也是一个可以用来测试新想法的工具，所以成为科技巨头的人工智能竞争的焦点。

Deepmind是如何实现人工智能在围棋领域的突破的？

人类在下围棋时往往基于盘面来进行决策，而近期人工智能领域核心的深度神经网络算法非常擅长从棋盘的各种模式中进行归纳总结，因此非常适合下围棋。借助于深度学习实质上是让机器学习人类的下棋风格，然后对人类棋手进行有效的复制。

DeepMind的人工智能围棋系统Alpha Go包括两种不同的深度学习神经网络架构:第一种叫做策略网络（policy network），用来预测下一步；第二种叫做价值网络（value network），用来预测棋盘上不同的分布会带来什么不同的结果。Alpha Go使用它们的方法是，把非常复杂的搜索树减少到可操作的规模，并不是在每一步都要考虑几百种步数，而只考虑策略网络提供的几十种最有前景的步法，价值网络的作用是减少搜索的深度，所以，它的搜索深度并不是特别深，它并不是一下子搜索出直达比赛末尾的300多步，而是搜索更少的步数，比如20多步，并评估这些位置，而不是一路评估到底，看谁最终能赢。所以这类搜索并不是靠蛮力，而是靠与人类直觉想象力类似的模式。

二、Deepmind为何受到谷歌青睐？

2014年1月26日，谷歌以4亿美元收购了人工智能公司DeepMind。神秘低调的DeepMind为何受到谷歌青睐?

1.Demis Hassabis颇具传奇色彩。他曾是国际象棋界的“天才儿童”，被世界智力奥委会称为“可能是史上最好的象棋选手”，12岁获得第一个国际象棋头衔、16岁通过英国A Level考试、是剑桥计算机科学最顶尖的毕业生(double first)。他在1998年创办了自己的游戏公司，而且取得了成功。哈萨比斯2005年进入伦敦大学学院，攻读神经科学博士学位，希望了解真正的大脑究竟是如何工作的，以此促进人工智能的发展。他选择了海马体作为研究对象，那里负责了一部分的记忆和空间导向功能，而且目前的科学对这一部位的认知相对较少。“我选择了一些我们不太了解的区域和功能。”他2007年进行的一项研究入选《科学》杂志的“年度突破奖”。在那项研究中，他证明了5位因为海马体受伤而患上健忘症的病人，在畅想未来时也会面临障碍。他认为大脑中与过去的记忆有关的部位，对于规划未来同样至关重要。他就此认定，记忆和未来规划是交织在一起的，并以此为依据展开了新的尝试。2011年，他中断了博士后的研究，创办了DeepMindTechnologies公司，并且以“解决智能”为公司的终极目标。

2、Deepmind的人工智能技术具有独特性。用创始人Hassabis原话来说：“目前典型的人工智能大多从语言开始，而Deepmind是直接从感官经验开始。”

Deepmind技术为人熟知的是其在一款经典的打砖块游戏中的应用，其系统可以仅仅基于屏幕图像和获奖信号（游戏分数的增加或减少）通过选择上下左右等动作来学习玩游戏，并且最终取得高于人类的得分。最初在开始训练之前，Deepmind的系统对这款游戏一点也不知道：它不知道游戏的目标，是一直保持存活，还是杀掉些什么或者是破解一个谜题，它也不知道按键后的后果，也就是说，它看不到游戏中的任何物体。通过不断的试错，这个深度学习系统逐步的学习应该如何动作才能得到一个分数。还需要注意的是，这套系统面对所有不同类型的游戏均使用的是同一套架构，而不是由程序员根据每种游戏来设置有多少种可能的动作，比如前、后、左、右、开火（空格）等。

Deepmind人工智能技术具有极强的普适性。DeepMind展示其系统玩了7个Atari游戏，分别是激光骑士（Beam Rider），打砖块（Breakout），摩托大战（Enduro），乓（Pong），波特Q精灵（Q*bert），深海游弋（Seaquest），太空侵略者（SpaceInvaders）。玩这些游戏的过程中所用的网络深层架构、学习算法甚至超参设置都是完全一样的，充分说明了其系统的普适性。

DeepMind算法之所以“多才多艺”，源于其对两种机器学习方法的结合：

第一种是深度学习，受人脑启发的一种结构，在实验的基础上，该结构中模拟神经元层间的联结得到加强。深度学习系统能够从大量的非结构数据中获取复杂信息。Google正在使用这种算法来自动分类图片，目的则是为了进行机器翻译。

第二种算法是增强学习，这种决策系统的灵感源自动物大脑中的神经递质多巴胺奖励系统。该算法仅使用屏幕像素和游戏得分作为输入，为了在给定时间里，获取最大奖励，算法不断通过试错(比如该如何行动?左转、右转还是开火)进行学习。在每种游戏上花费数小时后，系统掌握了一系列经典街机游戏的操作方式，包括赛车、拳击和Space Invaders。

3、DeepMind取得模仿人类大脑短期工作记忆的突破。利用计算机来实现人类大脑的短期工作记忆，是人工智能长期追求的目标。DeepMind在人们已经有着悠久探索历史的短期记忆方面取得了突破性进展。DeepMind已经建立了一个可以像常规的图灵机一样访问外部存储器的“神经网络图灵机”，这个“神经网络图灵机”能模拟人类大脑的短期记忆。相对于传统的普通计算机的内部寄存器，“神经网络图灵机”可以存储更复杂的表示变量的模式。

三、Deepmind有望提升Google各项业务智能水平

Deepmind在Google收购后计划再招50人，除75%的员工从事基础研究外，其余则组建了“应用研究团队”，专门探索如何将DeepMind的技术融入谷歌现有的产品。从公司目前的战略规划来看，公司所研究的通行人工智能是指将非结构化信息转化成有用的、可行动的知识，其未来应用方向主要在三个方面：

1、与Google现有业务融合。谷歌大脑支撑着搜索、日历、文档、图片、翻译、阅读、地图（自动驾驶）等各项业务，DeepMind无疑将有效提升谷歌大脑的智能水平，进一步加强包括深度学习在类的人工智能技术与已有业务的融合。例如DeepMind的技术可以用于改善YouTube的推荐功能，并提升该公司的移动语音搜索功能。

2、为机器人“注入”自主学习能力。机器人是谷歌最近大举投资的一个领域，仅2013年就收购了8家机器人公司，但谷歌此前并没有明显提升所收购的机器人能力，原因之一就是它们的程序通常是事先编好的，在处理和学习未知的新事物时表现很糟糕，而Deepmind的通用学习能力将有效改变这一局面。

3、帮助攻关重大科技项目。DeepMind创始人哈萨比斯表示，他的梦想是创造“人工智能科学家”。由于Deepmind出色的通用学习能力，其可以协助人类对重大科技项目进行攻关。例如可以在实验室里针对疾病生成和检验新的假设，谷歌内部已经考虑将其应用于Alphabet旗下Calico---一个致力于延长人类寿命的公司。

四、收购Deepmind对Google的人工智能战略影响

1、DeepMind发展带来担忧，谷歌成立人工智能伦理委员会。Google在收购DeepMind后不久专门成立了人工智能伦理委员会。DeepMind联合创始人Shane Legg认为团队技术的发展将有可能会毁灭整个人类。“最终，我认为人类灭绝很有可能会发生，而技术将有可能在此发挥了重要作用”。他认为人工智能是“本世纪的头号威胁”，这是“不祥”的东西。Google也开始担心以这种方式发展的计算机技术所带来的“双刃剑”般的影响，人工智能伦理委员会的任务就是确保人工智能技术不被滥用。虽然目前DeepMind技术还停留在玩Atari游戏的阶段，但由于其人工智能技术的主要作用是为了“解决任何问题”随着人工智能向前发展，这种巨大的潜力令人类震惊，如果不加以限制，将超出人类可控的范围。

2、有望助力推广谷歌开源人工智能系统“TensorFlow”。2015年11月10日谷歌以免费开源的形式向公众开放人工智能系统 “TensorFlow”。TensorFlow 是 Google自己开发的第二代人工智能系统，使用TensorFlow编写的运算可以几乎不用更改，就能被运行在多种异质系统上，可支持CPU、GPU、桌面机、服务器和移动计算平台，即可跨数据中心运行，也能跑在智能手机上。

开放人工智能系统实质上是Google安卓路线的再一次复制，表明Google将人工智能视为移动互联网之后又一个巨大的产业机会。人工智能行业应用无处不在，但又需要极高的技术积累和硬件、数据资源投入，如果能够借助开源降低准入者门槛，创新应用将层出不穷，有望迎来产业的空前繁荣。

值得注意的是DeepMind使用的是Facebook的开源AI 项目Torch，而非Google自身的“TensorFlow”。实际上由开源人工智能系统引发的生态竞争日趋白热化，Google并不是第一个意识到应该开源人工智能系统的巨头，微软、FACEBOOK等巨头均纷纷开放了自身的人工智能平台。作为已经被Google收购的 DeepMind，这一现状有望改变，而凭借DeepMind领先的技术和巨大应用前景，将大力推动谷歌人工智能生态的拓展。

五、投资建议

谷歌旗下的DeepMind团队研发的人工智能算法击败欧洲围棋冠军Fan Hui是在迈向更类似人类直觉的人工智能道路上的里程碑事件，展现了人工智能的巨大潜力。人工智能也被我国科技界视为实现弯道超车的一次难得的历史机遇，我们继续坚定看好人工智能这一未来最重要的产业方向，重点关注：思创医惠（携手全球人工智能龙头IBM沃森）;东方网力（视频大数据龙头，参股全球领先的家用机器人和安防机器人）;长高集团（收购金惠科技，图像视频智能识别领域稀缺优质标的）;科大讯飞（"讯飞超脑"进军认知智能制高点）;汉王科技（人脸识别、读写识别等领域领军企业）;东方国信（大数据智能分析龙头）;佳都科技（旗下云从科技的人脸识别技术已经在金融行业应用）。

本站仅提供存储服务，所有内容均由用户发布，如发现有害或侵权内容，请点击举报。