打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
合作的进化
userphoto

2022.07.13 四川

关注

书友你好,欢迎来到非凡精读馆,我是路一鸣。今天跟大家分享的这本书,叫《合作的进化》。

 

 

 

有人说这本书有资格跟《圣经》相提并论,为什么评价这么高呢?因为它告诉了我们,一个人应该怎么跟别人、跟社会打交道,甚至回答了一个困扰很多人一生的问题:好人究竟有没有好报?你看《农夫与蛇》《东郭先生与狼》,那说的都是好人没好报,坏人恩将仇报的事。再看看现实当中,那些吃亏上当的人是不是大多是好人,大多是善良的人?所以越来越多的人觉得好人没好报。

 

 

 

这本书就是从博弈论的角度,帮我们分析并且判断,在跟别人打交道的时候,在跟别人构成的社会环境打交道的时候,应该采取什么样的策略?我们应该做一个好人,还是应该做一个坏人?怎么做好人才能让自己有好报呢?当好人遇到坏人的时候,好人应该怎么做,才能让这个社会上好人越来越多,坏人越来越少?

 

 

 

我们跟别人打交道的时候基本上有两种选择,就是我们要不做一个好人,要不做一个坏人。

 

 

 

什么叫做好人?做好人就是宽以待人。我很善良地对待你,我也不图贪你的便宜,我也不设计一个局让你吃亏,反正我就跟你合作。当然我要考虑我个人的利益,但是我不损人利己,我在满足我的利益的时候也保证你的利益,这就等于是做好人了。

 

 

 

做坏人恰恰反过来,我得想方设法地占你的便宜,我得让你吃亏,我弄个当让你上上,这就叫做坏人。

 

 

 

我们平心而论,反正甭管做好人还是做坏人,不管我们选择用好人的策略,还是坏人的策略跟别人打交道,我们的目的本来是不是都是获得个人利益的最大化?

 

 

 

接下来的问题就是,什么时候做好人,什么时候做坏人,才能实现我的利益最大化呢?

 

 

 

很幸运,这也是很多学者们关心的问题,他们也非常想知道,在假设人人都利己的前提下,怎么会出现合作呢?人们为什么要合作呢?什么样的合作方式才是最有效的呢?

 

 

 

这本书的作者就是一位博弈论专家,他叫罗伯特·阿克塞尔罗德,是一个大学教授,他设计了博弈论研究领域里最著名的计算机竞赛,对这个比赛结果的研究,就是这本书的基本内容。

 

 

 

注意,前边我们在说做好人,还是做坏人,但是在博弈论里用的词不叫好人还是坏人,叫合作与背叛。选择当好人还是当坏人,在博弈论的策略里就叫选择合作策略,还是背叛策略。

 

 

 

一、做好人,还是做坏人,哪个更赚?

 

 

 

01 囚徒困境:坦白从宽,还是抗拒从宽?

 

 

 

为了更好地理解博弈论,我们先从它的起点,也就是囚徒困境开始。什么叫囚徒困境?两个坏蛋被警察抓住了,警察说你们两个谁先招供,谁就获得奖励。那个不招供的人就要受到处罚。

 

 

 

为什么叫囚徒困境呢?我们来看看这个矩阵(如下图)。

 

 

 

 

 

 

在这张图里,行和列分别代表了参与博弈的双方。在博弈过程中,如果你是参与的一方,你的最优策略是什么策略?

 

 

 

假设对方选择合作:

 

情况1:对方合作,你选择合作,两个人各3分。

 

情况2:对方合作,你选择背叛,对方0分,你5分。这个时候你选择背叛比合作好,5分比3分高。

 

 

 

所以,如果对方合作,你就应该背叛。

 

 

 

假设对方选择背叛:

 

情况1:对方背叛,你选择合作,你0分,对方5分,他占了你便宜.

 

情况2:对方背叛,你选择背叛,他1分,你也1分。虽然只有1分,但是总比被对方占便宜好,比0分好。

 

 

 

所以如果对方背叛,你就应该背叛。

 

 

 

前面第一种大的情况我们说的是什么?如果对方合作,你就应该背叛。所以,对你来说最优策略是,不管对方合作还是背叛,你都要选择背叛。

 

 

 

反过来也一样。对另一个参与者而言,他的最优策略也是背叛。

 

 

 

好,那么现在困境来了。对单一参与者而言,不管对方怎么选择,最优策略都是我要背叛,结果两个人共同的选择都是背叛,收益是各1分。但是请注意,我们明明选择了一个最优策略(就是不管对方选择什么,我的策略都能让得到每种情况下的最高分),但最后怎么才得了1分?但是我们也知道,明明有一个更好的分数,是可以获得3分的。就是我们双方合作,各得3分不好吗?这就是囚徒困境中的困境。我们选择了最优策略,却失去了一个比最优策略的结果更好的结果的机会。

 

 

 

到这里,我们可以从囚徒困境的基础模型里,学到博弈论教给我们的第一个常识性结论:

 

 

 

一个人的收益,不仅来自于他选择的策略,也来自于对方选择的策略,是双方的策略共同作用的结果。

 

 

 

我们翻译成大白话,就是你跟别人打交道,重要的是对方选择做好人还是坏人。

 

 

 

02 理想和现实的博弈,谁败给谁?

 

 

 

最现实、刻骨铭心的一句话:理想很丰满,现实很骨感。我们看到囚徒困境就明白了,这是因为你在跟社会、跟无数他人打交道的过程中,最后结果不是自己一方决定的,是双方共同作用的结果。

 

 

 

你按照你的设想去给出一个策略、一个动作的时候,对方根本不按你的套路来,那最后磨平的过程,就是现实很骨感的过程。囚徒困境告诉我们的道理就是,好人到底有没有好报,在单一的一次跟对方打交道的过程中,取决于对方是好人还是坏人。

 

 

 

如果你说我们吃一堑,长一智,知道陷入囚徒困境的原因是仅仅站在自己立场上,选择了自己认为的那个所谓最优策略,那下一次学会了、学乖了,我们俩下次碰面的时候,会不会自然地就吃一堑,长一智,选择合作呢?不会!

 

 

 

为什么?因为只要你们打交道的次数是限定的,次数是可预期的,那双方都会采用背叛的策略,大家会再次陷入囚徒困境中。因为经过这一次或者有次数限制的博弈后,你们俩就再也不打交道了,不管合作还是背叛都没机会了,所以在这一次里,人们仍然要选择那个所谓最优策略,也就是背叛。

 

 

 

二、人人利己,合作从哪儿来?

 

 

 

01 打破困境,实现最大收益

 

 

 

那如何打破囚徒困境呢?第一个条件就是要重复博弈。

 

 

 

大家第一次碰面,你也不认识我,我也不认识你,这个叫单次博弈。单次博弈就会陷入囚徒困境,打破囚徒困境首先要打破单次博弈。

 

 

 

第二个条件,收益预期要足够大。

 

 

 

为了更好理解,我们举个例子来说明什么叫重复博弈,什么叫未来收益足够大。

 

 

 

我们有没有这样的体验或者经历:旅游的时候,到车站、码头这些客流量大,你这辈子再去第二次的可能性又很低的地方。这种地方什么事多?假冒伪劣商品多,吃亏上当的机会多。怎么这些地方、卖旅游商品的地方容易坑人呢?为什么车站、火车站、码头假冒伪劣的东西就多呢?

 

 

 

我们想一想,提供这类商品和服务的商贩们的策略是什么?他们对博弈的预期是什么?就是这里客流量很大,一天经过十几万人,这些人下回再来的可能性很低,再来可能都要五年之后了,所以我和他之间是单次博弈。你买东西的时候不会意识到这一点,你忘了你们是单次博弈,所以他愿意用假冒伪劣来坑你一把,坑一把是一把。坑完你,你也就走了,经过收益成本的分析,你也懒得再花时间、花精力,回来再起诉他,所以这是单次博弈。

 

 

 

什么叫未来收益预期足够大?就是这人天天从车站里出来,就到某个商贩这里买东西。如果真有这么一个旅客,店主给他提供的肯定是真的东西。因为一旦提供了假的东西,就是背叛了他,坑了他了,就会影响未来的收益。这里的未来预期收益是什么?就是这人下回再也不来买东西了。

 

 

 

所以这本书要解决的第一个问题就是,在利己主义者中间,什么条件下才会产生合作。

 

 

 

囚徒困境面对的情况是,在面对一件事情的时候,我们会有不同的选择,但是这两种选择导致的结果不会是你死我活,这不是博弈论里的零和博弈。什么是零和博弈?它指的是我赢你就肯定输,那叫下象棋,那是零和博弈,因为只有一方能赢。而囚徒困境是指,我们有多种策略选择,在每一种策略选择之下,收益的结果不一样。面对不同策略,我们怎么选择那个让我们收益都变得更大的策略呢?它关心的是这个问题。

 

 

 

02 一报还一报的善良策略

 

 

 

回到我们在一开始就讲的问题,那个每个人都要面对的问题:人这一生要跟那么多人打交道,跟他们打交道的时候,我到底做个好人,还是坏人?我要不要做个善良的人?我跟对方是合作,还是骗他一把,自己占点便宜?对应在博弈论里就是,我应该合作,还是背叛?我采用哪种策略呢?

 

 

 

作者一开始也不知道,所以他设计了一个计算机程序大赛。

 

 

 

他邀请全世界来自心理学、经济学、政治学、数学和社会学五个领域的专家,而且他们都是对博弈论是有过研究的人。让这些人设计一套自己的策略程序,来看看哪一种策略在跟别人打交道的过程当中最有优势,得分最高。

 

 

 

他一共收到了14个程序,这14个程序两两之间做博弈,打交道,一共是5轮比赛,每次200局,一共是12万次对决,有24万个不同的策略组合,这些策略每个都不一样,各种各样的,刁钻的稀奇古怪的策略都有。最后谁赢了?是所有的程序里最简单的那个程序得了最高分,这个程序就叫一报还一报。

 

 

 

一报还一报程序是怎么运行的?第一步他一定先选择跟对方合作,从那以后他的选择就是在重复对方上一步的选择。第一步他跟对方合作,不管对方跟他打交道的第一步是合作还是背叛,一报还一报下一步的策略一定是重复、去模仿对方上一步的策略。你刚才跟我合作了,我接下来就跟你合作。你刚才背叛我了,我接下来就背叛你。

 

 

 

一报还一报是所有程序里最简单的程序,但是得分最高。这还不是最令人震惊的,在前8名的程序里,所有程序都是善良的程序。

 

 

 

那你说第一次大家可能还不懂,设计的程序也太简单,没拿这当回事。好,作者又组织了第二轮比赛。第二轮比赛做了进一步的升级,首先他邀请的参赛者更广了,又增加了计算机科学、物理学、进化生物学的教授,这一次他一共收集到了63个程序,而且他把第一届比赛的结果还告诉了所有人,让大家看到第一轮比赛中哪些程序的得分是多少,排名是什么。

 

 

 

第二轮的比赛结果呢?谁赢了?谁是冠军?还是一报还一报。一报还一报是所有的参赛程序里唯一没有被改动过的程序,第二轮又赢了。

 

 

 

在第一轮里,前8名都是善良的程序。那第二轮比赛什么结果呢?第二轮比赛前15名的程序里,只有一个是不善良的,后15名只有一个是善良的。也就是好人排名都在前边,坏人排名都在后边。

 

 

 

有人还是不服气,还是不放心,难道一报还一报这么厉害吗?他们开始改游戏规则。游戏规则做了6次更改,让一报还一报碰到的策略对手更多样化、更刁钻、更狡诈,当然也有可能更单纯。6个变形的比赛规则之下,一报还一报5次排名第一,1次排名第二。

 

 

 

从这样的比赛结果中,我们可以得到这本书告诉我们的第二个重要的结论:

 

 

 

在跟别人打交道的过程中,我们首先要保持善良,然后根据对方的策略,随时调整转换我的策略,以其人之道还治其人之身,就是最好的策略。

 

 

 

现在我们来看看一报还一报厉害在哪儿,怎么就能在每一次不管面对什么对手的时候,都得高分呢?它的特点是什么?

 

 

 

善良性。

 

 

主动地跟对方合作,从来不主动让自己陷入麻烦,所以第一步永远是合作,不管对方是不是认识的、熟悉的,在跟陌生人打交道的时候,第一步都是合作,这是它的善良性。

 

 

 

2. 可激怒性。

 

 

 

我不能白白吃亏,你只要坑我一回我就记住了。我第一步先合作,接下来我就模仿你上一步的策略,你跟我合作了我下一步还合作,你要是背叛了我,我下一步一定背叛你,这叫可激怒性。

 

 

 

3. 宽容性。

 

 

 

如果对方合作我马上就合作,因为我在模仿你的策略。你要一直背叛我,我就一直背叛你,你有一次开始跟我合作了,我马上就开始跟你合作,不计前嫌。

 

 

 

我们作为家长跟孩子之间该怎么打交道?我们都特别爱孩子,特别想满足孩子的各种要求。带孩子去商店,孩子突然看见一个特别好玩的玩具,他就要买。我觉得不能给他买,他坐地上打滚,好多人都围观,他让我很难堪。我该怎么做?我一开始跟他合作,他有合理的要求我都满足他,他撒泼打滚我就不能满足他。那孩子知道错了我要不要记仇?不用。明天还记这事吗?不用记了。如果孩子下次懂礼貌、守规矩,我们就要表扬,甚至还提供奖励,这叫宽容性。

 

 

 

有的程序设计成了你只要背叛我一次,我下次碰见你永远背叛,不管你是什么反应,不管你合作还是背叛,我就一直背叛下去,这不叫人不犯我,我不犯人,人若犯我,我必犯人,这叫人若犯我,我记你一辈子。

 

 

 

这样的策略得分很低。为什么得分低?因为每一次对对方的无限制的惩罚,都会遭致对方的背叛,导致自己的收益也降低。还记得博弈论告诉我们的第一个结论吗?就是你跟对方打交道的过程中的收益,不仅取决于你的策略,也取决于对方的策略,是你们双方策略共同的结果决定了最后的收益。所以你如果一直惩罚对方,毫不原谅,从来不给对方改过自新的机会,你得到的也只能是背叛,而你的收益就会降低。

 

 

 

总结一下,善良性、可激怒性和宽容性,是一报还一报的前三个特点。

 

 

 

4. 清晰性。

 

 

 

一报还一报一点都不复杂,很容易就琢磨透了。不首先背叛对方,可是如果对方背叛他,他就会报复。如果对方不再背叛他了,他也就不再报复对方了。简单一点就是,对方是坏蛋,他肯定是坏蛋。对方要是好人,他就是好人。这个规则特别清晰,所以可以被很多人理解。

 

 

 

03 生态模拟:好人和坏人谁活得更长?

 

 

 

如果一报还一报是最有效的策略,但是大千世界无奇不有,谁都有自己的策略,也都有自己的策略的生存土壤,如果采用一报还一报的策略,这些策略能繁荣下去吗?能在社会上变得越来越多吗?

 

 

 

我们这作者也没闲着,他也想知道这个问题的答案,所以他又做了一次模拟,叫计算机生态模拟。这个生态模拟的目的是要看看这些策略的代际传承是什么结果,或者我们更直白地说,如果让不同策略无休止地、无限制地博弈下去,最后得分低的那些策略还有没有生存空间?

 

 

 

在模拟结果的呈现上,我们看到了一个令人非常震惊的答案,像一报还一报这样的规则,有越来越多的人会采用;那些投机取巧的,坑蒙拐骗、得分低的规则,也就是所谓坏人规则、不善良的规则被淘汰了,善良的规则,做好人的规则,慢慢地发展起来了。

 

 

 

现在你是不是被这本书得到的结论鼓舞到了?但是作者没有停止探索,他提出了另外一个问题:在一个相对固定的策略规则里,一个新的规则来了,这个新的规则怎么能够落地生根呢?用专业术语解释,叫什么策略是集体稳定的?这句话什么意思?就是把好人扔进坏人堆里,好人能不能活下去?把坏人扔进好人堆里,是会把好人带坏,还是坏人可以变好?

 

 

 

结论是,当一个好人被扔到坏人堆里的时候,他活不下去。什么情况下,好人策略可以落地生根?大概占5%或者至少有两个策略是善良的策略的时候,才会落地生根。因为这种情况下,好人总有机会碰到一个善良的策略,双方都合作,收益变大,只要合作的频次有足够保障,收益就一定会高于跟坏人合作。有5%这样的策略,善良策略就可以落地生根。大概经过代际的传承,坏人就会越来越少,好人就会越来越多,因为合作的收益永远比背叛的收益要大。

 

 

 

反过来,坏人扔进好人堆里,就一个坏人,你说他会把好人带坏,还是被好人淘汰?同样的结果,就一个坏蛋的情况下,他会被好人淘汰。如果是俩坏蛋呢?俩坏蛋也会被淘汰。

 

 

 

大家还记得什么叫好人策略吗?是一报还一报。一报还一报不是永远做好人,不是任人宰割,所以,一报还一报这样的优势策略是稳定的,它会把那些贪小便宜,占别人便宜,挖空心思损人利己的人排挤在外。

 

 

 

我相信到这个时候,大家心里一定有疑问,为什么有的时候现实不是这样呢?这个问题我们会在接下来对一报还一报的进一步解析当中给出答案。

 

 

 

我们现在记住了什么策略是稳定的,什么样的条件下能够导致合作:

 

 

 

未来的收益足够大,善良的策略就是稳定的。

因为未来收益足够大,大家才会合作。

 

 

 

2. 保持可激怒性。

 

如果我们要保持一个策略的稳定,还有一个前提,必须要被可激怒。

 

 

 

思考一下,溺爱是怎么来的?溺爱就是那个孩子撒泼打滚的时候,你终于屈服了,你满足了他的要求,你没有转身就走,所以这个孩子不管做什么,都能够得到他想要的那个结果,你都会想尽办法满足他。

 

 

 

为什么现在车站、码头、旅游景点卖假冒伪劣商品的越来越少了?因为公权力的存在,让一报还一报变成了可能。不是那个吃亏的人去报复他,是有一个公权力代表你去报复他。根据市场的规则,你卖假冒伪劣产品,我就要处罚你,而且处罚得很重。所以他和你在一起合起来变成了一报还一报。法律、规则都是一报还一报策略的具体的执行者。

 

 

 

注意,可被激怒它的本质含义是背叛的策略一定要被报复。

 

 

 

这里作者提醒了我们一点,就是合作是追求收益最大化的一个策略选择,其实是基于现实利益的考量,大家不用跟友谊、道德联系起来。你跟他不认识,一报还一报一样起作用,你跟他是好朋友,一报还一报也是最优策略。

 

 

 

04 战场上也能产生合作?

 

 

 

作者在书里甚至给我们举了一个敌对双方实现合作的例子。

 

 

 

第一次世界大战期间,英国和德国两军对垒,结果他从57个师的一百七十多份战地日记里,发现了一报还一报的这种合作策略。是怎么在敌对双方之间发生的呢?这种策略在当时战争环境里叫让自己活,也让别人活。

 

 

 

一个战线上双方对垒,今天你打我,明天我打你。而且在相对稳定的时间里,双方营级单位的士兵都不会轮换,所以时间一长他们就知道,只要你打我,我就会打你,你今天杀害了我来送饭的两个炊事员,明天我一定会报复你。

 

 

 

在重复的博弈当中,双方都摸到了对方的脾气,就有一个奇怪的现象发生了。明明我军在敌军的射击范围之内,敌军也不开枪。同样地,他们在我们的射击范围内出现的时候,只要没有上峰的命令,我军也不开枪。一开始我们炊事员匍匐前进,后来吹着口哨就来了,因为他知道对方不会射杀他,因为只要他一射杀我们的炊事员,我们就会打击报复。

 

 

 

那如果阵地要换防了呢?换防的部队会告诉来接防的部队,说我们跟对方之间有这样的默契,所以你也不用先打他。这是在战争胶着状态,双方都各守阵地,谁也别想攻过去,因为反复争夺之下,总有一方还会攻回来。那如果上峰下了命令非要死命进攻呢?那就已经打破这种合作存在的前提了,因为有集权的存在了。

 

 

 

自己活,也让别人活不是个案,大家记住,这是来自57个师的一百七十多份战地日记,敌对双方都能达成这样短暂的、令人惊奇的合作,这就是一报还一报策略带来的让人意想不到的,但是又落地生根、繁荣发展的结果。我活,我也让你活;你活,你得让我活,这可以理解成一个互相制衡的结果,但是这种制衡的结果导致的合作,在敌对双方之间能够出现,一方面这当然令人叹为观止,另一方面也说明,博弈合作会出现在我们生活的诸多方面,而且不以友谊为前提。

 

 

 

三、认清现实,做一个理智的好人

 

01 这些行为要不得

 

 

 

既然我们已经接受了这个事实,理论推导、计算机模拟、现实的案例都告诉我们,要善良,要一报还一报,要被激怒,这对现实生活的帮助是什么呢?作者给我们列举了几条。

 

 

 

别嫉妒。

 

 

你在生活当中嫉妒别人没有用,你要获得更大的收益,前提是你也得让对方获得收益。嫉妒对方容易导致背叛,因为你心里不平衡,你嫉妒,你也不管收益有没有增加,你让对方的收益变小了,你心里就平衡了,这就是嫉妒的结果。你采用背叛的策略,你一背叛,对方就会报复你,结果你俩谁也没有好果子吃,你的收益也降低了。

 

 

 

你应该真诚期待跟你合作的人,跟你打交道的人获得成功,因为他成功了,他跟你的合作才会持续下去。

 

 

 

2. 不要首先背叛。

 

 

 

你一背叛对方肯定会背叛,双方一背叛收益就会降低。

 

 

 

3. 不管对合作还是对背叛都要给予回报。

 

 

 

这句话是不是让我们想到了孔子说过的话:以德报怨,何以报德。这就是一报还一报的策略,不管对方合作还是背叛,你都要给予回报。如果合作,你就合作;如果背叛,你就一定要背叛。

 

 

 

我们想一想校园霸凌是怎么出现的。就是当别人欺负你的时候,你还选择合作,你忍气吞声,霸凌的行为就会愈演愈烈。我记得我做法制节目主持人的时候,采访中国人民公安大学的李玫瑾教授,她告诉我怎么杜绝校园霸凌,就是要告诉孩子,第一次遇到霸凌行为的时候,就要坚决地说不,就要坚决地予以反击。反击的策略不是跟对方厮打,而是引用一个集权的力量,可以是老师,可以是家长,可以是其他的同学,甚至就是你自己,要勇敢地站在对方面前,必须向我道歉,否则这事不算完,对方就会收到你对他的报复行为,这就叫对合作和背叛都要给予回报。这个时候对方的霸凌行为,才有可能收敛。

 

 

 

这本书在分析一报还一报的时候,总是强调要给回报,不管是合作还是背叛都要给回报。这里的回报其实它指的是要对对方的策略行为给出相应的反应和反馈,而不是我们通常意义上那种善意的回报、报答。你不管做什么伤害我的事,有益于我的事,我都给你好处,这才叫回报吗?不是。这里的回报指的就是正向的反馈,不管是你跟我合作还是背叛我,我都要给出正面、直接的反馈,基于你的策略,我来给出我的反馈策略,这是这里的回报的意思。

 

 

 

4. 别耍小聪明。

 

 

 

作者在这个计算机模型比赛中发现,有一些程序的设计者老想耍小聪明,就是一开始表现挺规律的,你合作我就合作,你背叛我就背叛,但是他会抽冷子背叛一次。当你对我放松警惕的时候,我背叛一次,我占你一个小便宜,我在这个回合里占你便宜,这样的策略有没有得高分呢?并没有。因为囚徒困境不是零和博弈,不是你拿了这个好的,你拿了好处对方就失去了所有,就竹篮打水一场空,不是。囚徒困境是我们有多种选择,不是你死我活,你耍了小聪明,对方会记住你,下次都会反馈到你身上。所以,你对对方的策略,包括耍小聪明,最后由于重复博弈,都会反射到你自己的身上。

 

 

 

所以大家记住,对我们现实生活的几个提示:

 

不要嫉妒。

不要首先背叛。

对合作和背叛都要给予回报。

别耍小聪明。

 

 

02 更好促进合作,让大家都有赚头

 

 

 

我们刚才说的都是不要做什么,那我们要做什么呢?我们做点什么才能促进彼此的合作呢?作者也给出了建议。

 

 

 

要增大未来的影响。

 

 

我们想一下,非凡精读或者是樊登读书用来解读和指导婚姻、生活的书籍多,还是用来指导我们怎么交朋友的书籍多?肯定是婚姻家庭的书籍多,为什么?因为重复博弈未来的收益足够大,它足够让我们花时间、花精力去学习这方面的知识,这就是增大未来的影响。

 

 

 

2. 让接触更加频繁。

 

 

 

这个现象在我们的实际生活当中也比比皆是。很多甲方厂家,就是买方那里,怎么会有那么多的供应商名录呢?这供应商名录干嘛的?自然是对供应商资质提出一个标准。但这个资质又是怎么来的呢?就是长期合作长期打交道的结果。时间证明这些供应商是符合我的采购标准的,所以我让他们进入名录。

 

 

 

如果新来了一个供应商,水平跟他们差不多,质量跟他们一样,甚至有可能比他们还好,就是没在你的名录里,能不能变成你的供应商?一般情况下不可能。这一些还都是著名的厂家做出的决策,他干嘛要拒绝一个潜在的供应商,一个可能更优秀的供应商?因为他要增加彼此合作、接触的频繁程度,你们这几个供应商我告诉你们,我们以后会经常打交道,一直打交道,所以谁也别想骗我,谁也别想坑我。

 

 

 

我们想得更深一步,企业其实也是这么出现的。两个人,一个做鞋带,一个做鞋面,三个人之间再加一个做鞋底的。鞋带、鞋面加鞋底组成了一只鞋,我们三个人本来谁也不挨着谁,你买我的鞋带,我买你的鞋面,后来发现我们仨经常打交道,我们省掉那个互相讨价还价的过程,我们合伙好不好?我们一合伙,接触的频繁程度就更增加了,因为没别人了,有别人我们都不愿意选了,我们仨是一伙的,这个企业就形成了。大家就不再用市场交易的方式完成彼此之间的合作,这时候合作就更加频繁了。

 

 

 

3. 改变收益值,让合作的收益大于背叛的收益。

 

 

 

你不是撒泼打滚吗?那就不理你了。但如果你表现得很通情达理,那也许我们明天可以去环球影城玩一圈。让未来改变合作的收益,让合作的收益值显得足够有诱惑力,大于背叛的收益。

 

 

 

4. 有点让我意想不到,关心他人。

 

 

 

虽然前面说了合作的前提不是友谊,但教育的好处是让人们具有关心他人的动机。这动机干嘛用的?那就是在跟别人打交道的时候,你可别光想着自己。博弈的基本规则就是,收益取决于双方的策略,不是你一个人说了算的。如果你关心他人,你就能想到对方的利益在哪里,你就会主动地采取那种合作的策略。

 

 

 

5. 促进合作的方法就是要回报。

 

 

 

这个前面也说过了,反正不管他是背叛还是合作,你都要回报。他背叛,你还合作,你就是唐僧,你就叫溺爱。他合作,你背叛,你就是小人。他合作,你也合作,你就给了他一个积极的信号,他下次还跟你合作,你们双方的合作就建立起来了,就会持续下去。

 

 

 

6. 改进辨别的能力。

 

 

 

你得记住这个人上一次跟你打交道的时候,采用的是什么策略,你会在接下来跟他打交道的时候采用相应的对策。一报还一报就是你上次怎么对我的,我这次就怎么对你,这叫以其人之道还治其人之身。那如果你忘了呢?你还保持一个善良的策略的规则,你有可能一直被人占便宜,因为你忘了他上次坑过你了。

 

 

 

品牌意味着什么,在我们的现实生活当中,品牌就是要告诉你我是个品牌,我可不是地摊货,不是三无产品。我是品牌,意味着我要持续经营这个产品,要持续树立这个品牌,要持续经营这家企业,所以你可以相信我这次不会坑你,因为我下次还准备卖你东西,我还准备卖别人更多的东西,我会珍惜我的品牌形象,这就叫让你对我有一个清晰的辨识度。我是一个品牌,我跟别的品牌不一样,我跟没有品牌的商品更不一样。品牌的建立,就是出于增加辨识度,给人以未来预期的信心这样的初衷建立的。

 

 

 

四、国家之间的博弈行为

 

 

 

到目前为止,我们讲的这些合作好像都是好人、坏人,我、别人,那我们再放大到国家和社会层面,是不是也是遵循这样的道理呢?当然也是。

 

 

 

国家之间经常会有威慑、威胁,核威慑能力是干嘛用的?就是要告诉对方,我是会被激怒的。我一旦被激怒,后果你可得想清楚。我有核武器,或者是我会报复什么手段施加在你身上,我警告你,这就叫威慑。

 

 

 

更现实的例子,这贸易战是怎么来的?某国先发出了威胁,你要不做出改变,我就要提高我的关税,另一国马上作出反应,我国将对等地制裁你们,提高关税。后来这边也没按对方的意思做,那边真提高关税了。相应地,反击方也提高自己的关税作为报复,两边的贸易战就这么起来了,关税越加越高。最后的结果是什么,有一方承受不住了,关税这么高,我国人民生活水平下降了,负担太重了,现在我们要采取调低关税。

 

 

 

等他开始合作了,另一方应该怎么反应呢?当然是也进行合作。你要敢报复,你要敢背叛,我就一定背叛,这是贸易战背后的机理。

 

 

 

这道理好简单,一报还一报谁不知道呢?一说就懂了。为什么社会上还有这么多冲突,国家之间,人与人之间,还有那么多狡诈,那么多破坏规则,违法,甚至犯罪的行为呢?合作为什么就没有自然而然地出现呢?

 

 

 

在这本书的最后,作者说了一段话,我们一起分享一下这段话:

 

 

 

如何从合作中得到奖赏的问题,核心在于试错、学习,是缓慢和痛苦的,这样的学习过程,可能对长期发展有好处,但是我们可能没有时间等待这样盲目的过程,而缓慢地走向基于回报的,对双方有利的策略。也许如果我们更好地了解了这个过程,我们就能用我们的预见,加快合作的进化。

 

 

 

这段话什么意思?指的是从博弈论的研究结论上看,一报还一报这样的合作策略是最优的,是让所有人都受益的,但有的人目光短浅等不了,就是要在短期利益上占你的便宜,让别人上当,让自己获益,他还洋洋自得。但是从长期的合作博弈上看,这样的策略会被历史淘汰,但也许他的寿命都没有长期到被淘汰的那一天,他觉得这辈子值了。这种时候我们就需要请出公权力,代表一报还一报的正义的一方,帮我们维护还一报的权利,这也是社会公平得以实施的一个必要条件。

 

 

 

而对我们大多数人来说,只要我们相信未来的收益足够大,我们跟对方打交道的频率会增加,我们跟对方打交道的时间不知道什么时候才能结束,我们就应该选择一报还一报式的善良的策略,去诱发更多的合作,而不是对抗。

 

 

 

读完这本书,我的感觉那真叫万法归宗。不管这个世界的表象是如何纷繁复杂、变幻多端,它背后起作用的基本道理就那么几条,其中今天我给大家介绍的一报还一报就是其中的一条。

 

 

 

到目前为止,我们的头脑当中已经构建起了一个清晰的图形和脉络。在所有的策略中,一报还一报是最优的策略,因为我跟所有人打交道的收益不仅取决于我的策略,也取决于对方的策略。在一报还一报的过程当中,我首先保持合作的善良性,其次要可被激怒,不管对方做什么,我都要给出直接的带有因果关系的回馈。

 

 

 

同时,我很宽容。如果他合作,我会不计前嫌继续跟他合作。在这样的策略之下,我跟所有的其它策略打交道,我最后的收益是最大的。不是因为我每一次都占了对方的便宜,都得了比对方更高的分,而是那些不善良的策略,那些没有我这么清晰明确简单的策略,在彼此之间的博弈过程当中,他们的得分变得越来越少,他们的竞争性太强了,反而让合作性更强的一报还一报的策略,获得了更优的结果。

 

 

 

所以,在日常的生活当中,我们首先追求合作,其次,要守住底线,保护我们自己的利益,不会白白吃亏。

 

 

 

今天我要带给各位的三份外卖就是:

 

 

 

博弈的收益不是取决于单方策略,而是取决于双方策略。在单次博弈里,好人确实可能没有好报,你要碰到个坏人你就没有好报,因为它不仅取决于你是不是好人,还取决于对方是不是好人。

重复博弈增加未来的收益,合作才能出现。如果你和对方经常要打交道,那你应该选择做一个好人。

在所有的博弈策略里,一报还一报是最好的策略,就是以德报德,以直报怨,所以我们应该做一个好人,而且要做一个有底线,有原则的好人。法律、社会规范,就是用来保护好人的,因为它们扮演了一个,你永远要打交道的善良的规则。

 

 

今天的这本《合作的进化》就跟大家分享到这里,如果各位书友听完之后有所收获,欢迎您点击屏幕上方的分享键分享给你的朋友。

 

 

 

谢谢大家。

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
博弈的最佳策略是“一报还一报”
人际交往|为什么做人不能太善良
善意无关道德, 贪婪没有好处
Ent专栏:当囚徒困境遇到自然选择
商战“囚徒困境”有解
一报还一报:出来混迟早要还的 李新瑞老师的网校Office 最专业的教师、学生、家长交流的...
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服