按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!
哈灵顿程序就不是这样.它得到高分时.对方必然得到低分。它的成功是建
立在别人失败的基础上的,而失败者总是要被淘汰的.当失败者被淘汰之后.
这个从失败者身上占便宜的成功者也被淘汰。
即使在一个极端自私者所组成的不台作者的群体中,一报还一报也能够
生存。
实际上.我们从逻辑上也可以理解这一点。假设少数采取一报还一报策
略的个人在这个世界上通过突变而产生了。那么,只要这些个体能互相遇见,
足够在今后的相逢中形成利害关系,他们就会开始形成小型的合作关系。
I艟
报还一报:出来混迟早要还的
一旦发生了这种情况,他们就能远胜于周围的那些准备主动背叛的类型。
这样,参与合作的人数就会增多。很快,一报还一报式的合作就会最终占上
风。而一旦建立了这种机制,相互合作的个体就能生存下去。如果不太合作
的类型想侵犯和利用他们的善意,一报还一报策略强硬的一面就会狠狠地惩
罚他们,让他们无法扩散影响。
爱克斯罗德发现,只要群体的5%或更多成员是一报还一报的,这些合作
者就能生存;而且。只要他们的得分超过群体的总平均分,这个合作的群体
就会越来越大,最后蔓延到整个群体。相反,不合作者无论在一个合作者占
多数的群体中有多大比例,都是不可能越来越多的。
这就说明.社会向合作进化的棘轮是不可逆转的,群体的合作性会越来
越大。爱克斯罗德正是以这样一个鼓舞人心的结论.为人类突破囚徒困境指
出了一条道路。
在一在二不在三
公元前512年,吴王闽阃执政,为了称霸诸侯,他四处网罗人才,先后
把伍子胥和孙武收到自己的麾下。不久。吴国和楚国之间爆发了一场大规模
的战争。
说起这场战争的起因却非常简单,吴国边境有一个小镇叫卑粱,这里与
楚国的边境小镇钟离接壤。虽然分属于两个不同的国家,但是两个小镇的人
之间相处得一直十分和睦。有一日,吴国的一个小筏子采桑叶.与楚国的小
孩子吵了起来,双方的边民因此发生争斗。楚平王得知以后,派大兵去平了
卑粱。吴王以牙还牙。也派公子光带兵去攻打楚国。吴国大军浩浩荡荡开赴
边境,不费吹灰之力就把楚国防守的钟离和居巢荡平了,乘势直追楚国的腹
地,逼得楚国急忙撤军。
公元前506年,楚国为了报复。出兵攻打已经归附吴国的小国——蔡国。
吴国派大将孙武率领兰万精兵.乘船逆淮河而上教援。楚军赶忙遇兵.在汉
水设防。没想到孙武却突然弃船登岸,从陆路奔袭楚国腹地。吴军五战五胜,
占领了楚的国都郢城。然而,这时越国乘吴军伐楚之机进攻吴国,秦国叉出
硒I
博彝论的确}舻
兵帮助楚国对付吴军,这样.阖闯不得不引兵返吴。此后,吴又继续伐楚.
孙武率领大军挥师直下,一直打到郢都,迫使楚昭王仓皇出逃。
因为两个小孩的争吵而导致楚国几乎被灭亡的这一连串战争,·在其演进
过程中,我们可以清晰地看到一报还一报策略的作用机制。
一报还一报的策略解释了一个纯粹自利的人何以会选择合作,只因为合
作是自我利益最大化的一种必要手段。如果对方知道你的镶略是一报还一报.
那么对方将不敢采取不合作策略.因为一旦他采取了不舍作策略,双方便永
远进入不合作的困境。因此,只要有人采取一报还一报策略,那么双方均愿
意采取合作策略。
但是这个策略面lI占着这样一个问题:如果双方存在误解,或者由于一方
发生选择性的错误,这个错误是无意的,那么结果将是双方均采取不合作的
策略,
在这里,一报还一报箫略反映出了自己的局限性。两个以牙还牙者会从
合作开始.然后.由于各方反应一致,合作似乎注定可以永久地持续下去,
从而彻底避免囚徒困境问题。但是,不管出现误会的几率怎样微乎其微(即
便是小到万亿分之一),只要有可能出现误会,长期而言,一报还一报策略会
有一半时间合作,一半时间背叛。理由是,一旦出现谋会.双方将问题复杂
化与澄清误会的可能性一样大。这么一来,一报还一报策略其实就跟扔硬币
决定合作还是背叛的随机策略差不多,因为后者选择合作和背叛的几率也是
相同的。即使出现误会的几率很小,也只是将出现麻烦的时间推迟了。而且,
反过来,一旦出现误会.就要花更长时间才能澄清。
由于资源的约束。在现实中没有人支出足够的时间、精力来辨识和维持
对别人的各种回报,尤其是当他拥有很多博弈对手的时候。由于各种偶然的
因素,误解随时随地都有可能发生。比如.两个小孩于之间的争吵可能被看
敌对行为的开始而引发战争。
如何做到回报的“相称”又是一个问题:对手偶然背叛了你,你通过行
动或者不行动来显示你对此介意,你自己觉得是相称的“警告”,但对手很可
能认为你反应过度,小题大做。因而会出现这样一种情况:哪怕是微不足道
的误解一旦发生,一报还一报策略的双赢就会土崩瓦解。
这个缺陷在人工设计的电脑锦标赛中并不明显,因为电脑根本不会出现
报还一报:出来混迟早要还的
误解。但是,一旦将一报还一报策略用于解决现实世界的问题,误解就难以
避免,结局就可能是灾难性的。一方对另一方的背叛行为进行惩罚。对手受
到惩罚之后.不甘示弱,进行反击。这一反击叉招致第二次惩罚。无论什么
时候.这一策略都不会只接受惩罚而不做任何反击。由此将形成一个循环+
惩罚与报复就这样自动持续下去。
从这个角度来说.一报还一报策略在现实世界中会出现两种缺陷:第一,
实在太容易激发背叛;第二,它缺少一个宣布“判此为止”的机制。
当博弈中考虑到这种随机干扰——即由于误会而开始互相背叛的情形时.
吴坚忠博士经研究发现,以修正的一报还一报策略对双方会更有利。这种修
正包括两个方面:一是“宽大的一报还一报”,即以一定的概率不报复对方的
背叛;二是“悔过的一报还一报”,即以一定的概率主动停止背叛。
当某一背叛行为看上去像是一个错误而非常态举止的时候,你应该保持
宽容之心。必须记住的一个重要原则是,假如有可能出现误会.不要对你看
见的每一次背叛都进行惩罚,而要采取“在一在二不在三”的策略。你必须
猜测一下是不是出现了误会,不管这个误会来自你还是你的对手。这种额外
的宽容固然可能使别人对休稍加背叛,不过,假如他们真的背叛.他们的善
意也就不会再被相信了。误会一再出现时.你也不会再听之任之。所以,如
果你的对手有投机倾向,他终将自食其果。
如果对手的这一背叛是故意的.你当然也不想太轻易地宽恕对方而被对
方占了便宜。但是经过一个漫长的惩罚循环之后,也许到了该叫停井尝试重
建合作的时候了。
爱克斯罗德在《合作的进化》一书结尾早已指出:友谊并不是合作的必
要条件,即使是敌人,只要满足了关系持续、互相回报的条件也有可能合作。
合作不依靠善意、诚信或者一个外来的仲裁者,也完全可能从自私自利的冷
酷盘算中产生。比如,第一次世界大战期间在战场上自发产生的“自己活,
也让他人活”的原则。德英两军在战壕战中遇上了三个月的雨季,双方在这
三个月中达成了默契——互相不攻击对方的粮车给养,约束自己不开枪杀伤
人,只要对方也这么做。使这个原则能够实行的原因是,双方军队都已陷人
困境.三个月的时间给了他们相互适应的机会。
¨I
博彝论的;学舻
这个例子说明,友谊不是合作的前提
因此,我们也可以为“在一在二不在三”
迈向合作的一步。
台适的策略也能达成并保证合作。
的策略制定一些具体的操作,作为
(I'开始合作。
(2)继续合作。
(3)计算在你合作的情况下对方看上去背叛了多少次。
(4)假如这个百分比变得令人难以接受,转向一报还一报策略。
注意,与以前不同,此时的一报还一报策略不是作为对良好行为的奖赏,
相反,却是对企图占你便宜的另一方的惩罚。
要想确定令人难以接受的背叛的百分比是多少,你必须了解对方行为的
短期、中期和长期历史。仅看长期历史是不够的.一个人合作了很长时间并
不意味着他不会在声誉开始下降的时候企图占你的便宜,你还要知道“最近
他都对你做过什么”。
这种策略的确切规则取决于错误或误会发生的几率、你对未来获益和目
前损失的重要性的看法,等等。不过,在并不完美的现实世界里,这种策略
很可能胜过严格的一报还一报策略。
以直报怨的人生哲学
上面一节,实际上也是关于为人处世策略的一个讨论。在这方面,世界
各种文化中都留下了很多各不相同的教诲,并且存在着很多道德性的、价值
性的、形而上的分歧与争议。
接下来,我们用著名经济学家茅于轼的一殷经历,来说明人与人相处的
一个原则问题:当被别人以不正当的手段对待时.你应选择什么样的策略进
行反应。
有一天,茅先生陪一位外宾去北京西郊戒台寺游览。他们叫了一辆出租
车.来回90多公里,加上停车等待约两个小时,总计价245元。但茅先生发
现司机没有按来回计价。按当时北京市的规定.出租车行驶超过15公里之后
每公里从l 6元加价到2.4元。其理由是假定出租车已驶离市区.回程将是空
I¨
报还报:出来混迟早要还的
车。但对于来回行驶,因不会发生空驶,全程应按1 6元计价。显然,出租车
司机多收费了。
此时茅先生有三种选择。一是拒绝付款,司机将不得不屈从。因为如果
茅先生去举报他的违规行为.他将被处以停驶一段时间的处罚.损失更大。
这种办法叫做“人不犯我,我不犯人;人若犯我,我必犯人”,也就是“以怨
报怨”。你不守信用,我也不守信用;你欺骗我.我也欺骗你。用这种方法来
教训那些办坏事或破坏规则的人.他们吸取了教训或许会改辕易辙。鲁迅有
一段话说:“损着别人的牙眼,却反对报复.主张宽容的人,万勿和他接近。”
所采用的就是这种态度。
还有一种方法叫做“以德报怨”策略,也就是永远允许对方采取不合作.
而自己永远采取合作策略,你对我搞阴谋诡计,我仍旧对你友好。这种策略
可以避免冤冤相报无穷尽,但是却只可能被那些道德极端高尚的“圣人”所
采用.因为它是超越理性的。基督教《新约》上说,如果有人打你的左脸,
你应把右脸也让他打,用这种胸怀和博爱去感化对方。基督教相信人之初性
本善,每个人都有善的基因,只要有足够的力量去启动,坏人也能变为好人。
法国作家雨果的名著《悲惨世界》中.冉阿让偷了神父的东西被警察抓
住,神父却为他开脱,所采取的就是这种策略,并且产生了巨大的道德感召
力,使冉阿让重归正途。但是一般情况下,这个策略对采取者最为不利,因
为多数对手并不是冉阿让,而是一旦知道了你会采取这种策略后,他们会永
远采取背叛策略。
上述两种办法截然相反,但都有他们的道理。仔细想来确实叫人感到惊
奇。两种极端都有道理,其结果是怎么做都可以。对待坏人真的就设有有效
办法了吗?有没有既非以怨报怨,又非以德报怨的办法?
答案当然是有。那就是一报还一报策略的修正策略。孔子在几千年前就
提出了“以德报德,以直报怨”这样精彩的策略,所谓“直”.就是公正,以
直报怨就是按照事情本身的是非曲直.公正地回报对方的背叛.而不是以恩
怨来考虑当前的策略。
这种修正了的一报还一报,修正的是报复的程度,本来会让你损失5分,
现在只让你损失3分.从而以一种公正审判来结束代代相续的报复,形成
”I
博奔论的崩}劳
文明。
孔子反对以德报怨,因为这样做的话,对坏人也施以德,对好人也旆以
德,变成没有区别,于理不合。以直报怨包含两重意思:一是要用正直的方
式对待破坏规则的人,二是要直率地告诉对方,你什么地方办错了事。
出租车司机多收费,以怨报怨就是拒绝付款;以德报怨就是不但付钱还
给他一笔小费:以直报怨则是仍按规定付款,但要告诉他犯了规.以后改正。
经济学家茅于轼的做法是:指出司机的违规行为.但仍按规定向他付教。在
这种策略中.他们应付180元。另加停车场收费5元。
除了以德报德、以直报怨,我们常说的“投桃报李”、“人不犯我,我不
犯人”等都体现了一报还一报的思想。尽管这一策略并不是最优的.在充满
了随机性的现实社会里有这样或那样缺陷.但相对以德报怨和以怨报怨来说,
无论从哪个角度来说都是相对优势的策略。
输掉战役赢战争
千百年来,楚汉相争一直是中国人回昧无穷的历史片断。自司马迁的《史
记》把项羽描绘成“力拔山兮气盖世”的英雄以后,历代文人墨客往往崇敬
出身将门的项羽.而嘲贬出身平民的刘邦,李清照“生当作人杰,死亦为鬼
雄”的诗句更是把这种祟仰推到了极致。
抛开这些感性的评价,很多人也会对项羽兵败感到十分奇怪。项羽从起
兵到失败丧生历时七年,多是战绩辉煌,用他自己的话来说就是“身七十余
战,所当者破,所击者服”,最后却一战而全军溃敬.到底是为什么呢?项羽
最后自叹是“此天之亡我,非战之罪也”,其实也说明他正是带着上面这个疑
问死去的。
项羽于公元前209年与其叔项粱在江东聚集“八千子弟”造反,在随后
的反抗秦国的大战中.显示出无人能敌的强大战斗力,被各派割据武装推为
霸主。公元前206年义军占咸阳灭秦.项羽将刘邦打发到偏僻的汉中。自己
也离开当时天下最富庶的关中而东返彭城(徐州)立都。随后.刘邦暗度陈
仓夺取了关中,接着东袭彭城。项羽即刻回兵打败汉军。随后三年的楚汉战
《飘
报还一报:出来混迟早要还的
争呈持久形态。项羽屡战屡胜,汉军屡战屡败,然而项羽却于公元前202年
在垓下一败而溃。
力拨山兮气盖世的项羽败给文不知诗书、武不能阵战的刘邦,很多人都
归咎于偶然失手或一念之差,其实这是一种十分浅薄的认识。事实上。项败
刘胜恰恰说明.在任何一场战争中,只有战略的胜利者才是最后的胜利者,
是真正的胜利者。
对于这一点.我们也可以通过博弈论的研究得到证实。爱克斯罗德通过
数学化和计算机化的方法研究如何突破囚徒困境,在数学上的证明无疑是令
人信服的。他在计算机模拟中得出的一个非常惊人的发现:总分最高的人在
每次博弈中都没有拿到最高分。
这就像刘邦.每次战役都没有能战胜对手,但是随着战争的进行,实力
日益增强。相反.项羽能够从每一场战役中获得一些胜利.但是实力却愈战
愈衰。最后的结局也就可想而知了。那么这种强弱对比的转化是如何发生的
呢?
项羽起兵后.一直以起兵时的“八千子弟”为骨干。史学家曾考证这批
江东首义者的出身,发现多是些流浪、乞盗的江湖不逞之徒,虽然勇武好斗
却破坏性极强。他们纵横天下时。战斗力虽胜过诸侯之兵,却有焚杀劫掠恶
习。项羽正是在这批人簇拥下,制造了坑杀秦军降卒、攻城后焚烧洗劫一类
暴行。项羽在关中不敢久留,是因当地百姓对他恨之人骨。相反,初到关中
便“约法三章”的刘邦却赢得了威望。
第二个原因又是与第一点相联系的,那就是稳固的根据地。刘邦每次兵
败后都能恢复元气,关键是有关中作为后方,能源源不断地供应粮食和补充
兵员。战胜之际论功行赏时,刘邦把“抚百姓,给馈饷.不绝粮道”的萧何
列为三大功臣之首。项羽却从不注重建设后方,主要靠兵威四处索粮掠物,
所得不多又失民心,自然不能持久。正因如此,两军对决时,项羽部只能速
战速决,在一地相持日久就会出现“汉兵盛食多,项王兵罢食绝”。在垓下关
键一战中,楚军叉因“兵少食尽”军心动摇,饥兵听到“四面楚歌”便随之
瓦解。
评估一个策略成功与否.一个常见的方法是衡量它有多大能力来克服自
厶9 I
丫4.*#☆∞自}
f}
己