按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!
傲的时候应该确保对方不能预见。在警察与小偷博弈中,警察系统地偏向银
行,就是一种十分合理而且很容易理解的改善方式。但是同时,警察必须打
乱自己的巡逻目标才能降低小偷盗窃成功的概率。这么一来,他会让小偷永
远处于迷茫之中.也就没有办法获得准确预测的优势了。
从警察和小偷的不同角度计算最佳混合策略,会得到一个有趣的共同点:
同样的成功概辜。也就是说,警察若采用自己的最佳混合策略,就能将小偷
的成功概率拉到他采用自己的最佳混合策略所能达到的成功概率。
这并非巧合.而是两个选手的利益严格对立的所有博弈的一个共同点。
这个结果称为“最小最大定理”.由数学家约翰·冯·诺伊曼(John Von
Neumann)刨立。这一定理指出,在二人零和博弈中。参与者的利益严格相反
(一人所得等于另一人所失),每个参与者尽量使对手的最大收益最小化,而
他的对手则努力使自己的最小收益最大化。
他们这样做的时候.会出现一个令人惊讶的结果.即最大收益的最小值
“I
潦‰翟邕型
(最小最大收益)等于最小收益的最大值(最大最小收益)。双方都没办法改
善自己的收益,因此这些策略形成这个博奔的一个均衡。
最小最大定理的证明相当复杂,不过,其结论却很实用。假如你想知道
的只不过是一个选手之得或者另一个选手之失。你只要计算其中一个选手的
最佳混合策略并得出结果就行了。
所有混合策略的均衡具有一个共同点:每个参与者并不在意自己的任何
具体策略。一旦有必要采取混合策略,找出你自己的策略的方法,就是让对
手觉得他们的任何策略对你的下一步都没有影响。
这听上去像是朝向混沌无为的一种倒退.其实不然。因为它正好符合零
和博弈的随机化动机:一方面要发现对手任何有规则的行为,并相应采取行
动。假如他们确实倾向于采取某一种特别的行动,这只能表示他们选择了最
糟糕的策略。反过来,也要避免一切会被对方占便宜的模式,坚持自己的最
佳混合策略。
因此.采取混合或者随机策略,并不等同于毫无策略地“瞎出”,这里面
仍然有很强的策略性。其基本要点在于,运用偶然性防止别人发现你的有规
则行为井占你的便宜。
不可预测的算计
在传统政治中,有所谓“君臣一日而百战”的说法.来形容国君与大臣
之间博弈的激烈程度。因为激烈,所以其层出不穷的招式,给博弈论的研究
提供了丰富的案例。
《吕氏春秋》中记载了这样一个故事。战国时,宋康王极端变态,整天
喝酒,异常暴虐。凡群臣中有来劝谏的,都被他找理由撤职或者关押起来。
臣下也因此对他更加反感,经常非议他。他十分苦恼地对宰相唐鞅说:“我处
罚的人很多了.但是大臣们越发不畏惧我,这是什么原因呢7”唐鞅说:“您
所治罪的,都是一些犯了法的人。惩罚他们,没有犯法的好人当然不会害怕。
如果您要让您的臣子们害怕,就必须不区分好人坏人,也不管他犯法没有犯
法.髓便抓住就治罪。这样的话,大臣们就知道害怕了。”
警察与小偷博弈:猜猜猜与换换换
唐鞅提出的这个建议.虽然缺德了一些,但却不能不说是深刻地把握住
了混合策略博弈的精髓之处。能够预测的惩罚,大臣总会想方设法地加以规
避,而无法预测的惩罚,却是防不胜防的,因而也是更令人心惊胆战的。
宋康王也是个聪明人,听了这个主意以后恍然大悟,深深地点了点头。
不久,他就下令把唐鞅杀了,大臣们果然十分害怕,每天上朝时都战战兢兢
不敢多说一句话。
策略的随机性是博弈论早期提出的一个深谋远虑的观点。
众所周知.一个国家每年都需要源源不断地征召到年龄的青年人伍。如
果普通平民百姓大规模拒绝应征.因为法不责众,对违法者进行处罚成了不
可能的任务。这样,如何激励到了法定年龄的青少年去登记,等待政府征召
入伍.就成为一个很需要博弈智慧的工作。
不过,政府掌握着一个有利的条件:规矩制定权。我们不妨想像政府有
权力惩罚一个没有登记的人。那么,它怎样才能利用这一权力促使大家都去
登记呢,
政府可以宣布它要按照百家姓的顺序追究违法者。排在第一位的每一个
姓赵的人知道,假如不去登记就会受到惩罚。惩罚的必然性已经足以促使他
乖乖登记。接下来,排在第二位的每一个姓钱的人就会认为.既然所有姓赵
的都登记了.惩罚就会落到自己身上。这么依次分析下去.那些稀有姓氏欧
阳、公孙和诸葛家的人也都会乖乖就范。
如果一场博弈的参与者按照某种顺序排列.通常能预计到排在首位的人
会怎么做。这一信息会影响到下一个人,接下去影响到第三个人,如此沿着
整个行列一直影响到最后一个人。
可是问题在于.人数是如此众多.在这种情况下,可以预计到会有一个
很小数目的人群出差错。政府数不到诸葛们,或许等不到政府数完前几位
姓氏,一定就有人因为没有登记而受到惩罚。于是后面的人就不必担心被迫
究了。
真正有效的激励机制,是不要预先宣布任何顺序,而是随机抽取。好处
在于可以实施惩罚的数目完全不必接近需要激励的人群的数目。所谓杀一儆
百,惩罚1000名违法者.可以对数以百万计可能违法的人群产生阻吓作用。
拍I
?0. 博奔论的薄舻
我们不妨再举一个例子。假如存在人人都知道用来确定哪一家企业将会
受到税务审计的顺序。那么在企业报税的时候,必然就会参照这个次序,看
看自己会不会受到审计。假如预计到自己符合受到审计的条件,而又能找到
一个出色的会计师“修改”报税单,使其不再符合条件以免除被审计。没有
一家企业会拒绝这样做。
假如被审计已经无法避免.企业大概会选择如实申报。税务局的审计行
动若是具有完全可预见性,结果就会把审计目标确定在错误的人群身上。因
为所有那些被审计的人早就预见到自己的命运。早就选择了如实申报.而对
于那些逃过审计的人,能够看管他们的就只有良心了。假如税务局的审计规
律在一定程度上是模糊而笼统的,大家都有那么一点面临审计的风险.人们
也就会更加倾向于选择诚实。
商界也有类似的现象。在剃须刀市场上,假如吉列品牌定期举行购物券
优惠活动,比如每隔一个月的第一个星期天进行,那么毕克品牌可以通过提
前一个星期举行优惠活动的方式予以反击。当然,这么一来毕克的路数也变
得具有可预见性。吉列可以照搬毕克的策略,相应将优惠活动提前到毕克前
面去。这种做法会最终导致刺刀见红的残酷竞争,双方的利润都下跌。不过,
假如双方都采用一种难以预见或者多管齐下的混合策略.那么很可能会降低
竞争的惨烈程度。
使用随机策略本身既简单,又直观,不过要想在实践当中发挥作用,我
们还得做一些细致的设计。比如,对于网球运动员,光是知道应该多管齐下,
时而攻击对方的正手.时而攻击对方的反手,这还不够。他还必须知道他应
该将30%的时间还是64%的时间用于攻击对方的正手.以及应该怎样根据双
方的力量对比做出调整。
在橄榄球比赛里.每一次贴身争抢之前,攻方都会在传球或带球突破之
中选择,而守方则会把赌注押在其中一个选择上,做好准备进行反击。在网
球比赛里,发球一方可能选择接球一方的正手或反手.而接球一方则准备在
回击的时候选择打对角线或直线。
在这两个例子里,每一方都对自己的优点和对方的弱点有所了解。假如
他们的选择可以同时考虑到怎样利用对方所有的弱点.而不是仅仅瞄准其中
一个弱点.那么这个选择应该算是上上之策。
警察与小偷博弈:猜猜猜与换换换
球员和球迷一样都明白必须多管齐下,来些出其不意的奇袭。理由在于.
假如你每次都做同样的事情,对方就能集中全部力量最大限度地还击你的单
一策略,而且效果也会更好。
多管齐下并不等于按照一个可以预计的模式交替使用你的策略。若是这
样的话.你的对手也能通过观察发现这个模式.从而最大限度地利用它还击,
其效果几乎跟你使用单一策略一样好。
要记住,实施多管齐下的随机策略,诀窍在于不可预测性。
纯粹的随机策略
《清稗类钞》中记载,清代文学家龚自珍最喜与人押宝,自称能以数学
预测骰子点数。其蚊帐的顶部写满一二l_四等数字。无事就卧于床,仰观帐
顶,以研究其消长规律。他逢人便自夸赌学之精,闻声揣色,十猜八九。但
是龚自珍每下赌场,却又必输无疑。友人取笑他,问他何以屡博屡负。龚自
珍面带戚然地回答:“有人才抱班马,学通孔周,入场不中.乃魁星不照应也。
如我之精于博.其如财神不照应何?”
这种带有宿命论的解释不过是一种无奈的敷衍。心理学家已经发现,人们
往往会忘记这样一个事实.即投掷硬币翻出正面之后再投掷一次,这时翻出正
面与翻出反面的可能性相等。这么一来,他们连续猜测的时候就会不停地从正
面跳到反面,或从反面换为正面.很少出现连续把宝押在正面或反面的情况。
概率里有一个重要的概念是事件的独立性概念。很多情况下,人们因为
前面已经有了大量的未中奖人群,而去买彩票或参与到累计回报的游戏,殊
不知,每个人的“运气”都独立于他人的“运气”.并不会因为前人没有中奖
你就多了中奖的机会。
假如我们抛10次硬币,没有一次抛出了正面,下一次抛出正面的可能性
就大于上次吗?抛硬币出现正反的决定性因素很多,包括硬币的质地和你的
手劲,第11次投掷翻出正面的机会还是跟翻出反面的机会相等,根本没有“反
面已经翻得太多了”这回事。
拉斯维加斯的很多赌场,老虎机上都顶着跑车,下面写着告示.告诉赌
盯I
博彝论的蘑斤
客已经有多少人玩了游戏,车还没有送出,只要连得三个大奖,就能赢得跑
车云云。但得大奖的规则并无变化.每人能否得到跑车和前面的“铺路石”
毫无关系。同样,在六舍彩中,上周的号码在本周再次成为得奖号码的机会,
跟其他任何号码相等。
有很多东西对于人们的智力来说根本是不可预测的,与其让主观猜测干
扰我们的决策,不如采取纯粹的随机方式。居住在加章大东北部布拉多半岛
的印第安人,早就意识到了这一点。
这些靠狩猎为生的人们,每天都要面对一个问题:朝哪个方向进发去寻
找猎物?他们寻找问题答案的方式在文明人看来十分可笑。这种方法类似于
中国古代的烧龟甲占h:把一块鹿骨放在火上炙烤,直到骨头出现裂痕.然
后请部落的专家来破解这些裂痕中包含的信息.找出他们当天寻找猎物应去
的方向。令人惊异的是.这种完全是巫术的决策方法。竟然使他们经常能找
到猎物,所以这个习俗在部落中一直沿袭下来。
在这样的决策活动中,印第安人无意中将波特所说的“长期战略”运用
于其中。按通常的做法,如果头一天满载而归,那么第二天就应该再到那个
地方去狩猎。在一定时间内,他们的生产可能出现快速增长。但正如管理学
家说的,有许多快速增长常常是在缺乏系统思考、掠夺性利用资源的情况下
取得的.其增长的曲线明显呈抛物线状.在迅速到达顶点后将迅速地下滑。
如果这些印第安人过分看重他们以往取得成果的经验,就会陷入因过度猎取
猎物资源而使之耗竭的危险之中。
可以说,正是由于测不准原理的影响,如果我们选择随机,反而有可能
超越真宴与谎言的对立。我们虽然没有鹿骨可吼使用,但是仍然可以选择某
种固定的规则,来使自己的策略无法被预测。
但这种规则必须是绝对秘密而且足够复杂,使对手很难破解。
举个例子:看看本书的句子的长度。假如一个甸子包含奇数个汉字,把
它当做硬币的正面;假如一个句子包含偶数个汉字,把它当做反面。这就变
成一个很好的随机数字发生器。回过头来计算看过的10个句子,我们就会得
到一组正反序列。
假如本书不够轻便,没有关系,其实我们随时随地都带着一些随机序列。
瞽察与小偷博弈:猜猜猜与换换换
比如朋友和亲属的出生日期的序列,若出生日期是偶数.当做正面;若是奇
数,当做反面。也可以看你的手表的秒针。只要你的手表走得不准,别人便
没办法知道现在秒针究竟处于什么位置。
对于必须使自己的混合策略比例维持在50:50的棒球投手,我们的建议
是:每投一个球,先瞅一眼自己的手表。假如秒针指向一个偶数.投一个快
球;假如指向奇数,投一个下坠球。实际上,这种方法可以帮助你获得任何
混合策略方案。比如,现在你要用40%的时间投快球而用另外60%的时闻投
下坠球,那么,请选择在秒针落在l一24之间的时候投快球,落在25~60之
间的时候投下坠球。
糟糕策略的背后
唐朝末年.安禄山起兵造反。派遣叛将令狐潮率重兵包围了雍丘(今河
南杞县)。雍丘守将张巡留1000人守城.自己带领1000精兵,打开城门冲出。
张巡身先士卒。冲进敌阵猛砍,兵士个个奋勇。叛军做梦也没想到张巡敢冲
出城.措手不及.被杀得人仰马翻。第二天,令狐潮指挥士兵架起云梯登城
作战。张巡率领士兵把用油浸过的草捆点着后抛下城去,登城的叛军被烧得
焦头烂额,非死即伤。此后60多天里,只要一有机会,张巡就突然出兵攻击。
还用计夺取了叛军的大批粮食和盐。
粮盐虽足,但城中箭矢已消耗得差不多了。张巡让兵士扎了许多草人,
给它们穿上黑衣。当夜月色朦胧.张巡命令兵士用绳子把草人陆陆续续地缒
下城去。城外叛军见这么多人缒城而下,纷纷射箭.一时间箭如飞蝗。射了
半天.叛军发觉不对劲。因为他们始终设听到一声喊叫声,而且又发现这一
批刚拉上城去.那一批又坠下来.始觉中计。派人前去探查以后,他们方知
所射的都是草人。这一夜,张巡竞得箭10万支。
第二天深夜,张巡叉把外罩黑衣、内穿甲胄的草人从城上放下去。叛军
发现,乱射了一阵.发现又是草人。以后每天夜里,张巡都是如此,城外叛
军渐渐知道是计,也不再拿箭去射。这时.张巡决定发起总攻。这一日.张
巡把500名勇士趁夜色缒下城去,勇士们奋勇突进敌营。叛军一点准备也没
。厶9I
有,立时大乱。接着,叛军的营房四处起火,混乱中也不知来了多少官军。
最后,张巡率军直追杀出lO余里,大获全胜。
令狐潮的叛军开始发现城头缒下草人,用箭去射是对的。后来发现上当
受骗,就不再用箭射,那就不是很好的策略选择。无论缒下的是草人还是真
人,在一时无法辨别的时候,他们的最佳策略就是用箭去射。因为这样损失
的只是一些箭矢,这种损失与被张巡偷袭相比,显然是微不足道的。
这个故事给我们的启示在于:假如真能发现博弈对手打算采取一种行动.
而这种行动方针并非随机混合策略,那你就可以利用这一点占他的便宜。
博弈的特点就是相互猜测,你对对手的策略进行猜测。对手也在对你的策
略进行猜测。取胜的基本思路是要考虑对手的思路.所以博弈中还必须考虑到
对手也在猜测你,无时不在寻找你的行动规律,以便有的放矢地战胜你。
稳健是博弈的要务,想赢别人一定要先把赢的每一个环节都考虑周到,
不能让对手发现任何真实的规律,否则,想赢别人的时候往往也正是你的弱
点暴露得最明显的时候。如果没有真正了解对手的策略就仓促出手,对手就
可能乘机抓住你的弱点,你可能反倒要被别人赢掉了。
还是用网球比赛的例子来说,当发球者采取自己的均衡策略,按照40:
60的比例选择攻击对方正手方和反手方时.接球者的成功率为48%。如果发
球者采取其他比例,接球者的成功率就会上升。假如发球者很傻,决定把所
有的球都发向对方较弱的反手方.接球者由于早有预料.其成功率将会增至
60%。一般来说,假如接球者认识发球者,确切了解他有什么癣好,他就能相
应采取有针对性的对策。