一位学艺归来的拳师,与老婆发生了争执。老婆摩拳擦掌,跃跃欲试。拳师心想:“我学武已成,难道还怕你不成?”没曾想尚未摆好架势,老婆已经张牙舞爪地冲上来,三下五除二,竟将他打得鼻青脸肿,没有还竽之力。事后别人问他:“既然学武已成,为何还败在老婆手下?”拳师说:“她不按招式出拳,我怎么招架?"
民间早就有“乱拳打死老师傅”的说法,意思是如果一切都没有聿法,连老师傅都无法招架呢。这里的“乱拳”,可以看做是随机混合策略的一种形象叫法。
有一个游戏叫做“一、二、三射击”或称“手指配对”。在这个游戏中,其中一个选手选择“偶数”,另外一个选手则得到“奇数"。数到三的时候,两个选手必须同时伸出一个或者两个手指。假如手指的总数是偶数,就算“偶数”选手赢;假如手指的总数是奇数,就算“奇数”选手赢。
那么怎样才能保证自己不被对手所赢呢?
有人的回答是闭着眼“瞎出”。这话说对了一半,因为从博弈论的角度来看,“瞎出”也存在着一种均衡模式,必须加以计算。
因为只有奇、偶两种结果,整个局面是如此对称,以至于各个选手的均衡混合策略应该都是50:50。我们这就验证一下:假如“奇数”选手出一个指头和两个指头的机会是各一半,那么,“偶数”选手无论选择出一个还是两个指头,平均每场游戏将会赢得0.50×l+0.50×(-1)=0元。
因此,假如他的策略也是50:50,那么他的平均所得就是0元。同样的证明反过来也适用。因此,50:50混合策略对彼此都是最佳选择,它们合起来就是一个均衡。
这一解决方案就是混合策略均衡,它反映了个人随机混合自己的策略的必要性。
与手指配对游戏不同,很多情况下我们不应该将不可预测性等同为输赢机会相等,而是应该通过有计划地偏向一边而改善自己的表现,只不过这样做的时候应该确保对方不能预见。在警察与小偷博弈中,警察系统地偏向银行,就是一种十分合理而且很容易理解的改善方式。但是同时,警察必须打乱自己的巡逻目标才能降低小偷盗窃成功的概率。这么一来,他会让小偷永远处于迷茫之中,也就没有办法获得准确预测的优势了。
从警察和小偷的不同角度计算最佳混合策略,会得到一个有趣的共同点:同样的成功概率。也就是说,警察若采用自己的最佳混合策略,就能将小偷的成功概率拉到他采用自己的最佳混合策略所能达到的成功概率。
这并非巧合,而是两个选手的利益严格对立的所有博弈的一个共同点。
这个结果称为“最小最大定理”,由数学家约翰?冯?诺伊曼(John Von Neumann)创立。这一定理指出,在二人零和博弈中,参与者的利益严格相反(―人所得等于另一人所失),每个参与者尽量使对手的最大收益最小化,而他的对手则努力使自己的最小收益最大化。
他们这样做的时候,会出现一个令人惊讶的结果,即最大收益的最小值(最小最大收益)等于最小收益的最大值(最大最小收益)。双方都没办法改善自己的收益,因此这些策略形成这个博弈的一个均衡。
最小最大定理的证明相当复杂,不过,其结论却很实用。假如你想知道的只不过是一个选手之得或者另一个选手之失,你只要计算其中一个选手的最佳混合策略并得出结果就行了。
所有混合策略的均衡具有一个共同点:每个参与者并不在意自己的任何具体策略。一旦有必要采取混合策略,找出你自己的策略的方法,就是让对手觉得他们的任何策略对你的下一步都没有影响。
这听上去像是朝向混沌无为的一种倒退,其实不然。因为它正好符合零和博弈的随机化动机:一方面要发现对手任何有规则的行为,并相应采取行动。假如他们确实倾向于采取某一种特别的行动,这只能表示他们选择了最糟糕的策略。反过来,也要避免一切会被对方占便宜的模式,坚持自己的最佳混合策略。
因此,采取混合或者随机策略,并不等同于毫无策略地“瞎出”,这里面仍然有很强的策略性。其基本要点在于,运用偶然性防止别人发现你的有规则行为并占你的便宜。