DeepMind研制阿尔法狗的使命当然不是要下赢围棋

这几天我一直在围观人们的反应，最想不明白的一点，其实是人们究竟怎么开始把机器与人类放到对立的两面？

围棋是艺术，阿尔法狗是技术，它如何就会毁了围棋呢？棋手们自己不是也说“（现在下棋）或多或少都会受到阿老师的影响吧，下棋会让人感到更自由一些，没有什么招法是完全不能下的”（周睿羊，DeepMind博客视频），“阿尔法狗带给我们很多的新东西。现在呢，大家更多地去尝试以前都没有下过的各种下法”（时越，DeepMind博客视频）

棋手们的意思难道不是说，AI促使人类棋手更加强大，更乐于创新吗？

DeepMind创始人哈萨比斯

而对于人工智能科学家而言，阿尔法狗的使命，更不是要在围棋赛中打败人类。他们之所以让机器与顶尖的人类棋手互动，意在为“狗”提供一个不能用其他方式替代的学习环境。DeepMind创始人哈萨比斯自己在很多公开场合就不止一次地说过，是为了发现潜藏的通用知识（general knowledge)。“狗”，其实是一个通用智能体。

把DM的使命说得更冠冕堂皇些，何尝不是人类对自身的进一步探索？

正如物理学家费曼教授那句留在黑板上的著名遗言，“我所不能创造的，都是我没有真正懂得的”（What I cannot create, I do not understand)，如果世界在人们眼里是由外部世界和内心世界两部分组成的话，也许“内心”世界更加根本，因为外部世界的存在状态，根本还是取决于我们大脑对它的解释。这便是人工智能最引人入胜的地方：借助于建造它来更好地了解我们自己，理解这个世界。

DeepMind所致力建造的这一类AI，有个名字，叫“受神经学启发的AI”(neuralscience-inspired AI）。别忘了哈萨比斯本人就是伦敦大学学院的认知神经学博士，DM对人类身上最感兴趣的部位叫做海马体（Hippocampus）。按维基的说法：海马体是人类及脊椎动物脑中的重要部分，位于大脑皮质下方，担当着关于短期记忆、长期记忆，以及空间定位的作用。在阿兹海默病中，海马体是首先受到损伤的区域：表现症状为记忆力衰退以及方向知觉的丧失。大脑缺氧（缺氧症）以及脑炎等也可导致海马损伤。平常我们开玩笑时爱说的“老痴”或“脑残”都跟这个海马体相关。

我们需要记住，DM的AI有两个关键词，一是通用，一是学习。他们所有的算法都从元数据开始进行自主学习，从而掌握某项任务，这与预编程的人工智能有本质的不一样。此外，DM还强调，他们希望所有的系统能够通用，也就是说，希望同一个系统，或同一套算法可以有跨领域的广泛应用。公众所熟知的赢了国际象棋的IBM传奇深蓝，以及近年来的沃森系统，它们都仍然属于窄AI范畴，也就是说，它们是为了解决某个特定问题量身打造的AI，因而只能解决那一类问题。

而阿尔法狗这一类DM的AI，事实上则可以被叫做“通用人工智能”AGI（Artificial General Intelligence），目标既不针对特定任务，也无涉预编程。这就引出了眼下被热议的“强化学习”技术（reinforcement learning）。

描述强化学习其实非常简单，它有个一目了然的框架，框架内有两个内容：系统和环境。这里的“系统”就是我们说的AI，而它会发现自己处于某个“环境”当中，要达成某项目标。

“系统”与“环境”之间进行双向交流：首先，它通过其感知仪器来对“环境”进行观察，在DM的学习过程中，通常使用的是视觉，也就是说，“系统”观察到的就是像素。这些观察结果往往有很多“噪音”，并且信息不完整，因为现实世界本身就十分混乱，充满干扰，而且永远不可能对一件事获得真正完整的信息。“系统”的任务，便是要在这样的混乱条件下，创建一个可能的、最好的统计模型；这个最好的模型一旦建立，第二项任务，便是在当前的时间点上可供选择的一系列行为中，选出最好的一个，向目标靠近。而一旦“系统”确定了某一个行为是最佳之后，“系统”随即将这个行为作为输出，并得以执行。其结果，有可能会，也有可能不会，对当前的“环境”带来任何改变。但无论如何，它都成为新一轮观察的驱动。所以这个“系统”尽管表面上看，可以通过这样一个简单的框架图形来描述，但它事实上隐藏了很多的复杂性。

解决了隐藏其后的复杂性，其实就拥有了足够的智能来进行几乎一切学习。我们认同这个观点，因为我们知道，包括人在内的所有脊椎动物，都是这样来学习的。人类大脑中，完成这一“强化学习”过程的是多巴胺系统。

了解了创造出阿尔法狗的DM公司的通用智能使命，以及这一通用智能的学习原理之后，不难看出，各类游戏其实都是其算法的绝佳测试平台。一两年前连线杂志 “Wired” 就有过长文报道，DM最初使用经典的80年代雅达利游戏（Atari ）来测试他们的算法。当AI在玩雅达利时，它所获得的输入没有别的，就是纯粹的像素，完全就像人在看着屏幕学，屏幕尺寸大概是200*150，所以它所得到的就是每帧3万个点，目的也很简单，一切从头琢磨自学，为了拿高分。

在基本的学习能力具备后，再通过模拟海马体的工作原理，来为智能体增加能力，例如学习抽象概念，以及增进长期记忆。

如果说AI是在利用包括棋类在内的游戏来作为测试平台，达到提升功力的目的的话，它真正的目标可能更多地在于帮助人类完成更加关键的工作，例如与预测相关的医疗、气候、能源、宏观经济等应用。这样一来，人工智能技术可以毫无疑问地被认为是眼下最重要的技术之一，更可能正是潜在的“元解决方案”（meta-solution），可以协助人类解决所有的其它问题。

提到“元解决方案”，不可避免的是与之相伴的伦理讨论。在科幻作品、断章取义的名人演说、鸡毛令箭的媒体报道的共同作用下，AI所获得的伦理关注尤其热闹。但是它与任何强大的新技术无异，技术本身是中立的，决定它是否符合伦理的，永远是掌握技术的人。在此过程中，公众、媒体、研究机构（企业）以及政府几方的透明，对每一步的监管都因此变得至关重要。

阿尔法狗的创造者的使命是要将世界的信息组织起来，让它更好地为全世界共享，换句话说，就是利用 AI或者AGI 来自动将无序的信息转化为知识，从而利用这些知识使人类更加强大。因此，与世界最优秀的人工智能专家一起，挖掘出暗藏在围棋这一古老游戏后面的智慧，促成技术的进步，这应当是乌镇比武会上所有人的胜利吧。

原标题：DeepMind的使命不是要下赢围棋

本站仅提供存储服务，所有内容均由用户发布，如发现有害或侵权内容，请点击举报。