每颗心都在猜猜猜
谁会带来伟大爱情
每个人都在换换换
换了他她他还是不行
——杜德伟《统统绕》歌词
从防小偷地图谈起
据报道,2006年初,杭州市民孙海涛在该市各大知名论坛上建立了一个电子版“防小偷地图”,点开该地图网页,只要动动鼠标,就能知道杭州哪里最容易遭贼。这张地图问世以来,点击率迅速飙升。
这张电子版的“防小偷地图”是一个三维的杭州方位图,上面较准确地反映了杭州各条大街小巷及商场建筑。通过点击标注,网民们可以看到放大的该路段,具体可以细到某一幢大楼的名称。
除了地图上已标注的那些易被盗的地点外,网民还可以把自己知道的小偷出没的地方,随意地进行标注。截至2006年3月被广泛报道时为止,已经有40多人在该地图上添加新的防盗点。不仅地段标注特别详细,而且连小偷的活动时间、作案惯用手法都列得一清二楚。
针对网民的防盗地图,《南京晨报》的文章却问:“为何没有‘警方版防偷图’”?按说,小偷的情况,警察了解的肯定比普通市民多,他们怎么就没有想到设计一个防偷图呢?
实际上,问题并没有这么简单。《时代商报》的评论就指出,警方如果公布类似的“小偷地图”,很可能打草惊蛇。当小偷也看到地图的时候,肯定会转移战场。这个回答指出了问题的另一个侧面,但是并不足够。要想真正把这个问题说清楚,我们需要用到博弈论中的一个模型——警察与小偷博弈。
某个小镇上只有一名警察,他负责整个镇的治安。瑰在我们假定,小镇的一头有一家酒馆,另一头有一家银行。再假定该地只有一个小偷。因为分身乏术,警察一次只能在一个地方巡逻;而小偷也只能去一个地方。若警察选择了小偷偷盗的地方巡逻,就能把小偷抓住;而如果小偷选择了没有警察巡逻的地方偷盗,就能够偷窃成功。假定银行需要保护的财产价格为2万元,酒馆的财产价格为1万元。警察怎么巡逻才能使效果最好?
一种最容易被警察采用而且确实也更为常见的做法是,警察对银行进行巡逻。这样,警察可以保住2万元的财产不被偷窃。但是假如小偷去了酒馆,偷窃一定成功《这种做法是警察的最好做法吗?答案是否定的,因为我们完全可以通过博弈论的知识,对这种策略加以改进。
警察的一个最好的策略是,抽签决定去银行还是酒馆。因为银行的价值是酒馆的两倍,所以用两个签代表,比如抽到1、2号签去银行,抽到3号签去酒馆。这样警察有2/3的机会去银行进行巡逻,1/3的机会去酒馆。
而在这种情况下,小偷的最优策略是:以同样抽签的办法决定去银行还是去酒馆偷盗,与警察不同的是抽到1、2号签去酒馆,抽到3号签去银行。这样小偷有1/3的机会去银行,2/3的机会去酒馆。
警察与小偷之间的博弈,提供了混合策略的思路,但更形象的样板是“剪刀、石头、布”的游戏。在这样一个游戏中,不存在纯策略均衡。对每个小孩来说,出“剪刀”、“布”还是“石头”的策略应当是随机的,不能让对方知道自己的策略,甚至是策略的倾向性。一旦对方知道自己出某个策略的可能性增大,那么在游戏中输的可能性也就增大了。因此,每个小孩的最优策略是采取每个策略的可能性是1/3。在这样的博弈中,每个小孩各取三个策略的1/3是纳什均衡。
还有一种常见的混合索略样板就是猜硬币游戏。比如在足球比赛开场,裁判将手中的硬币抛掷到空中,让双方队长猜硬币落下后朝上的是正面还是反面。由于硬币落下地的正反是随机的,概率都是1/2。那么,猜硬币游戏的参与者选择正反的概率都是1/2,这时博弈达到混合策略纳什均衡。
这一类博弈与囚徒困境博弈案例有一个很大的差别,就是没有纯策略纳什均衡点,只有混合策略均衡点。这个均衡点下的策略选择是每个参与者的最优(混合)策略选择。
所谓纯策略是指参与者在他的策略空间中选取唯一确定的策略,是参与者一次性选取并且一直坚持的策略;而混合策略是指参与者在各种备选策略中采取随机方式选取并且可以改变,而使之满足一定的概率的策略。
在每个参与者都有优势策略的情况下,纯策略均衡是非常合乎逻辑的。一个优势策略优于其他任何策略,同样,一个劣势策略则劣于其他任何策略。假如你有一个优势策略,你可以选择采用,并且知道你的对手若是有一个优势策略他也会照办;同样,假如你有一个劣势策略,你应该避免采用,并且知道你的对手若是有一个劣终策略他也会规避。
但通过警察与小偷博弈我们看到,并非所有博弈都有这样优势策略,哪怕这个博弈只有两个参与者。实际上,纯策略只是博弈论的一种特例。特别是当博弈是零和博弈,即一方所得是另一方的所失时,只有混合策略均衡。对于任何一方来说,都不可能有纯粹的占优策略。
看到这里,我们就可以明白,“警方版”的防小偷地图,从博弈策略的角度来考察并不是一个很好的方案。