北京时间3月13日下午消息,谷歌人工智能AlphaGo与李世石对战第四场在韩国首尔四季酒店举行,李世石首次战胜AlphaGo,总比分扳回至3:1。双方交战仅剩余最后一场,下场比赛将于北京时间3月15日(周二)中午12点进行。
人们欢呼雀跃,李世石终于胜了一局,给人类挽回了一点尊严。
在我看来,这只是一个偶然。为什么这么说呢?
我们先看看AlphaGo的工作原理:
AlphaGo利用两大核心技术蒙特卡洛树搜索,神经网络系统,给出了有效的应对策略。这也是人工智能60年历史的里程碑事件,说明计算机通过深度学习在单一项目上超过人类智力成为可能!
我这里重点谈谈什么叫蒙特卡洛。
蒙特卡罗就是随机算法的意思,走迷宫用蒙物卡罗就是随便走。射箭就是随机射击。
再举个蒙特卡罗法算法的实际应用例子:
比如森林里有10000个苹果,你的任务是尽量寻找最大的苹果。由于只限制了10分钟内去寻找,你不可能去有时间去把这一万个苹果全部摘下来进行比较。于是你只能随机拿1个,再随机拿一个跟它比,留下大的,再随机拿下1个……你每拿一次,留下的都至少不比上次的小。拿的次数越多,挑出的苹果就越有可能越大。但是除非你能拿10000次,否则无法肯定挑出了最大的。这个算法就属于蒙特卡罗算法——尽量找好的,但不保证是最好的。
对应的就是穷举法,假定问题的最佳答案在某个范围里,将范围内的每个值
都试一遍,理论上一定可以找到最佳答案,就是把10000个苹果全拿来比较。
为什么电脑不用穷举法而蒙特卡罗算法呢?很简单,围棋的计算太复杂了,是个天文数字,现代的超级电脑都算不过来。
即便如此,电脑进行相对海量计算随机落子布局,然后对这些巨量随机布局进行打分评比,评出尽可能的较优落子。尽管不一定是最优的一步,也往往明显强于人类的布局。因为人类脑中的可选较优布局数量更少。
这也正是阿尔法狗此次输给李世石的原因,阿尔法狗的计算也是有限度的,也是随机计算的!
换句话说在总和为10000的苹果里选个子大的苹果,拿出3000个与拿出2000个来进行PK,并不能保证3000个苹果挑出的个头更大。即使大多数情况下用3000个做样本的胜率更高。
那么在炒股上运用人工智能的电脑计算能否击败人类呢?
阿尔法狗程序能用来做股市交易吗?
首先阿尔法狗只适合在完全信息的游戏中运用。而股市交易却是不完全信息的一场游戏。交易者需要在不确定性条件下做出决策。
先看看股市的变化有多少种吧。举个大盘短线交易的例子:
以今天的收盘价为参照,明天开盘就至少有3种变化:高开平开低开
明天盘中就有3种变化,高走 平走 低走
明天收盘也有3种变化,高收 平收 低收
这样明天至少就有27种变化吧?我的数学真的不太行。
实际只分析明天还不够,往往需要分析后天及大后天这几天的变化走势,那么至少需要27*27
再加上盘中异动,比如超大现手,直线拉升等N种变化
那就是27*27*N
在实战上还要分析这几个交易日的K线组合,不同的K线组合也对应着不同的后期变化。如果有三种K线组合可能发生,那么至少需要27*27*N*3
这就已经上万种变化需要电脑进行评分,然后寻找分数最高的最佳短期交易对策。
实际上这仅是一小步,还需要设立资金仓位配比,计算止损位,进行历史回溯性测算,计算历史上类似走势的成功概率及风险控制值……这也是个巨大的计算。
上面这些还是阿尔法能够计算的,后面的场外因素就是阿尔法狗束手无策的。
,市场经常会出现利好或利空,阿尔法狗必须把人类的种种心理对走势的变化影响计算在内。而这是很麻烦的。因为很多事件发生时是无法对人类的心理影响进行评比打分的。
比如人工智能无法算到飞机撞个楼就能对美国股市产生那么大的影响!就是说无法对人类心理引起的股市波动问题进行量化!
这种利好利空就犹如场外突然走过来一个人破坏规则向棋盘上多落了一子或拿走一个关键子。使原本较为清楚的应对策略成为一个败招。
股市经常会发生预测不到的事情——黑天鹅事件。 即使阿尔法狗有如此强大的运算能力,运用蒙特卡罗法进行取样计算也很难长久在股市赚到钱。因为对于股市这样的开放性混沌系统,无数的不确定性因素随时存在。阿尔法狗的有限计算就太小儿科了。